研究課題/領域番号 |
22KJ2473
|
補助金の研究課題番号 |
22J21151 (2022)
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 (2023) 補助金 (2022) |
応募区分 | 国内 |
審査区分 |
小区分07040:経済政策関連
|
研究機関 | 九州大学 |
研究代表者 |
島村 拓弥 九州大学, 工学府, 特別研究員(DC1)
|
研究期間 (年度) |
2023-03-08 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,200千円 (直接経費: 2,200千円)
2024年度: 700千円 (直接経費: 700千円)
2023年度: 800千円 (直接経費: 800千円)
2022年度: 700千円 (直接経費: 700千円)
|
キーワード | 大規模言語モデル (LLM) / 自然言語処理 / 画像処理 / 機械学習 / データベース構築 / 因果推論 / データベース |
研究開始時の研究の概要 |
本研究は、(i)多様なデータソースを活用した包括性・(空間的)解像度・汎用性の高いデータベースの構築と、(ii)計量経済学および情報工学的アプローチによる都市政策と指標づくりへの学術的貢献を目的とする。従来の環境評価とは異なり、環境面だけにとどまらず、教育や健康などの人的資本、インフラなどの人工資本を包括的に評価し相対化することで、社会全体としての適切な環境分野への投資や分配の在り方を提言することを目指す。
|
研究実績の概要 |
経済学・情報学・工学を融合させ、新国富 (Inclusive Wealth) の枠組みを応用することによって、社会の豊かさと持続可能性を評価する研究に従事した。多様なデータソースから独自性の高いデータベースを構築し都市空間における包括的かつ高解像度な社会インパクトの評価に取り組んでいる。 本研究は、(i)多様なデータソースを活用した包括性・(空間的)解像度・汎用性の高いデータベースの構築と、(ii)計量経済学および情報工学的アプローチによる都市政策と指標づくりへの学術的貢献を目的としている。 2年目の成果は、特に、(1)データセットの構築, (2)データセットの構築のための技術力の向上, (3)データ分析の3つが挙げれられる。(1)データセットの構築は、政府統計・SNS投稿・Web上のデータなどの2次情報としてのオープンソースを活用したデータセットの構築を行った。初年度に加えて、生成AIを活用することで、オープンソースの活用の拡充を図った。(2)技術力の向上は、従来的な手法では分析可能な形式にすることが困難であったデータを扱う技術(画像処理や自然言語処理)を習得した。例えば、画像データからテキスト情報を抽出しCSVにまとめる工程を自動化するために、テキスト情報を文字として抜き出す画像処理や、数百ページあるPDFレポートから該当する文章を検出する自然言語処理技術がある。(3)データ分析は、従来予定していた機械学習での分析に加え、大規模言語モデル(LLM)の活用を進めた。LLMの活用により、ゼロから自前の自然言語処理モデルを構築するのに加え、精度および試行や仮説検証のスピード双方を同時に向上させることに繋がった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データ構築の自動化がほぼ完了した。 分析では大規模言語モデル(LLM)や画像生成AIの登場が追い風になっている。 データ分析が完了しているにもかかわらずライティングに移れていない研究がある。
|
今後の研究の推進方策 |
●分析:データ構築の自動化がほぼ完了したので、集積したデータ分析を機械学習を使って分析してきます。特に、大規模言語モデルの登場で、これまでよりも格段に少ない工数で詳細な分析に踏み込めるようになったため、分析の粒度を細かくしていく方針です。 ●ライティング:データ分析が完了しているにもかかわらず、論文として仕上げられていない研究がいくつかあります。論文出版のためにライティングをしていきます。
|