| Project/Area Number |
23K24904
|
| Project/Area Number (Other) |
22H03648 (2022-2023)
|
| Research Category |
Grant-in-Aid for Scientific Research (B)
|
| Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
| Section | 一般 |
| Review Section |
Basic Section 61030:Intelligent informatics-related
|
| Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
大内 啓樹 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (70825463)
|
| Co-Investigator(Kenkyū-buntansha) |
若宮 翔子 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (60727220)
松田 裕貴 岡山大学, 環境生命自然科学学域, 講師 (90809708)
進藤 裕之 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 特任准教授 (20734784)
|
| Project Period (FY) |
2024-04-01 – 2026-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥13,910,000 (Direct Cost: ¥10,700,000、Indirect Cost: ¥3,210,000)
Fiscal Year 2024: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2023: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2022: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
|
| Keywords | 自然言語処理 / 地理空間情報 / 実世界接地 / 地図 / 地理情報システム / ジオコーディング / 意味解析 / 記号接地 / 地名抽出 |
| Outline of Research at the Start |
計算機によって文章中の人物の地理的な移動を読み取り、その移動軌跡を実世界の地図上に接地(グラウンディング)する問題に取り組む。この問題を通じて、テキストデータを移動軌跡データに変換および対応付けるシステムを構築し、時空間データ解析や地理情報科学など幅広い分野での応用を可能にする。その実現に向けて次の3つの課題に取り組む。課題A:テキスト情報と実世界地理情報の両方を取り入れた新たな解析パラダイムの提案。課題B:移動軌跡接地システムの学習・評価に用いるデータセットを構築する。課題C:観光経路推薦アプリケーションへの組み込みを通じて、移動軌跡接地システムの応用利用の方法論を探究する。
|
| Outline of Annual Research Achievements |
本研究では、自然言語で記述された文章から筆者の地理的な移動軌跡を抽出し、実世界の地図上に再現するAI技術の開発を目的としている。これにより、テキストに内在する時空間的情報を構造化し、人文地理学や地理情報科学など多分野に貢献する新たな情報処理基盤の確立を目指す。 2023年度までに、文章中の地名や施設名の抽出、およびそれらの訪問地を時系列順にアノテーションしたデータセットを整備しており、本年度はこのデータセットを活用して、著者の訪問地の順序を推定するモデルの開発および評価に取り組んだ。BERTや大規模言語モデルを用いて、文脈的手がかりを活用したベースラインモデルを構築した。さらに、複数のモデルを比較し、誤り傾向の分析を行った。特に、地理的な階層関係の認識に大きな課題があることが明らかとなった。これにより、今後のモデル改良やデータ拡張の方針に関する有用な知見が得られた。 現在、本成果をもとに論文を執筆し、査読付き国際会議に投稿済みである。今後、採択後の公開を見据え、モデルおよび分析コードの整備と再現性確保に向けた準備を進めている。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、自然言語で記述された文章から人の移動軌跡を読み取り、それを地図上に再現するためのAI技術の開発を進めてきた。これまでに、場所を表す言語表現の抽出や位置情報との対応付けに関する基礎技術を確立させ、現在はその応用・実装段階に差しかかっている。 2023年度までの段階では、文章中に登場する地名や施設名を高精度に抽出し、それらを地図上の具体的な緯度・経度座標と対応づけるためのデータセットおよび機械学習モデルを構築した。これらの成果を活用し、入力された文章から地図上に軌跡を描画する実働システムの開発を完了している。 2024年度には、これに加えて、文章の筆者が訪れた場所を時系列に整序する技術の開発に取り組んだ。具体的には、時系列情報のアノテーションを含む新たなデータセットを構築し、それを活用したベースラインモデルの設計と実装を行った。この成果を基に学術論文を執筆し、現在、査読付きの国際会議に投稿し、採択結果を待っている段階である。 さらに、今後の研究の発展と再現性の確保を目的として、構築したデータセットを研究目的に限り広く公開するための準備も進めている。また、開発したモデルについても、オープンソースとしての公開を目指し、精度および汎用性の向上に向けた継続的な改良を重ねている。
|
| Strategy for Future Research Activity |
今後の研究では、これまでに得られた成果を踏まえ、三つの観点から本研究をより実践的かつ学術的に発展させていく方針である。 第一に、文章中の地理的移動軌跡を地図上に接地する技術を応用し、一般ユーザにも利用可能な実働システムの開発を行う。具体的には、任意の文章を入力として受け取り、その中に記述された訪問地や移動の順序を解析し、地図上に軌跡として可視化するインタフェースを整備する。本システムは研究者や教育関係者による活用を想定し、誰でも利用可能な形でオープンソースとして公開することで、再現性の高い研究の基盤を提供することを目指す。 第二に、このシステムを用いて、従来十分に構造化されてこなかった人文地理学や国際関係論などの領域におけるテキスト資料を解析対象とし、これらの分野における新たなテキスト分析手法の創出に貢献する。とりわけ、旅行記や外交文書など、空間的・時間的情報が豊富に含まれるテキストを対象とし、学際的連携のもとで応用実験を展開する。 第三に、現在構築済みのデータセットは高品質である一方で、データ量の点では限定的であった。今後は、より大規模な学習・評価環境を整備するため、クラウドソーシングの活用によるアノテーション作業の拡張や、大規模言語モデル(LLM)を活用した自動アノテーション手法の導入を検討している。これにより、より汎用的かつ実用性の高い軌跡接地技術の確立を目指す。
|