2023 Fiscal Year Research-status Report
Comprehensive and high-resolution social impact assessment of urban space using diverse data sources
Project/Area Number |
22KJ2473
|
Allocation Type | Multi-year Fund |
Research Institution | Kyushu University |
Principal Investigator |
島村 拓弥 九州大学, 工学府, 特別研究員(DC1)
|
Project Period (FY) |
2023-03-08 – 2025-03-31
|
Keywords | 大規模言語モデル (LLM) / 自然言語処理 / 画像処理 / 機械学習 |
Outline of Annual Research Achievements |
経済学・情報学・工学を融合させ、新国富 (Inclusive Wealth) の枠組みを応用することによって、社会の豊かさと持続可能性を評価する研究に従事した。多様なデータソースから独自性の高いデータベースを構築し都市空間における包括的かつ高解像度な社会インパクトの評価に取り組んでいる。 本研究は、(i)多様なデータソースを活用した包括性・(空間的)解像度・汎用性の高いデータベースの構築と、(ii)計量経済学および情報工学的アプローチによる都市政策と指標づくりへの学術的貢献を目的としている。 2年目の成果は、特に、(1)データセットの構築, (2)データセットの構築のための技術力の向上, (3)データ分析の3つが挙げれられる。(1)データセットの構築は、政府統計・SNS投稿・Web上のデータなどの2次情報としてのオープンソースを活用したデータセットの構築を行った。初年度に加えて、生成AIを活用することで、オープンソースの活用の拡充を図った。(2)技術力の向上は、従来的な手法では分析可能な形式にすることが困難であったデータを扱う技術(画像処理や自然言語処理)を習得した。例えば、画像データからテキスト情報を抽出しCSVにまとめる工程を自動化するために、テキスト情報を文字として抜き出す画像処理や、数百ページあるPDFレポートから該当する文章を検出する自然言語処理技術がある。(3)データ分析は、従来予定していた機械学習での分析に加え、大規模言語モデル(LLM)の活用を進めた。LLMの活用により、ゼロから自前の自然言語処理モデルを構築するのに加え、精度および試行や仮説検証のスピード双方を同時に向上させることに繋がった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データ構築の自動化がほぼ完了した。 分析では大規模言語モデル(LLM)や画像生成AIの登場が追い風になっている。 データ分析が完了しているにもかかわらずライティングに移れていない研究がある。
|
Strategy for Future Research Activity |
●分析:データ構築の自動化がほぼ完了したので、集積したデータ分析を機械学習を使って分析してきます。特に、大規模言語モデルの登場で、これまでよりも格段に少ない工数で詳細な分析に踏み込めるようになったため、分析の粒度を細かくしていく方針です。 ●ライティング:データ分析が完了しているにもかかわらず、論文として仕上げられていない研究がいくつかあります。論文出版のためにライティングをしていきます。
|