文章中の人物の移動軌跡を実世界の地図上に接地するための基礎研究とその応用
Project/Area Number |
23K24904
|
Project/Area Number (Other) |
22H03648 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
大内 啓樹 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (70825463)
|
Co-Investigator(Kenkyū-buntansha) |
若宮 翔子 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (60727220)
松田 裕貴 岡山大学, 環境生命自然科学学域, 講師 (90809708)
進藤 裕之 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 特任准教授 (20734784)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥13,910,000 (Direct Cost: ¥10,700,000、Indirect Cost: ¥3,210,000)
Fiscal Year 2024: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2023: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2022: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
|
Keywords | 自然言語処理 / 地理空間情報 / 地理情報システム / ジオコーディング / 実世界接地 / 地図 / 意味解析 / 記号接地 / 地名抽出 |
Outline of Research at the Start |
計算機によって文章中の人物の地理的な移動を読み取り、その移動軌跡を実世界の地図上に接地(グラウンディング)する問題に取り組む。この問題を通じて、テキストデータを移動軌跡データに変換および対応付けるシステムを構築し、時空間データ解析や地理情報科学など幅広い分野での応用を可能にする。その実現に向けて次の3つの課題に取り組む。課題A:テキスト情報と実世界地理情報の両方を取り入れた新たな解析パラダイムの提案。課題B:移動軌跡接地システムの学習・評価に用いるデータセットを構築する。課題C:観光経路推薦アプリケーションへの組み込みを通じて、移動軌跡接地システムの応用利用の方法論を探究する。
|
Outline of Annual Research Achievements |
本研究の課題Bとして、旅行記中の著者が実際に訪れた場所を指す表現(場所表現)を、地図上の位置(経緯度)に時系列順に対応付ける。すでに場所表現のアノテーションとそれらを経緯度に紐付けるアノテーションは完了した。本アノテーションデータセットを無償公開した。本データセットをベースにした論文は国内で賞も受賞し、研究者が広く使用可能な貴重なリソースに仕上がった。また、実際に著者が訪れた場所の認識とその時系列順序についてのアノテーション作業も行った。本データセットの公開と、本データセットを元にした成果を論文にまとめて公開を目指す。 課題A「テキスト情報と地理情報の相互作用を取り入れた新たな解析パラダイムの確立」に取り組んだ。まず、すでにアノテーションの完了している「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルを構築した。さらなる改良を重ね、国際会議への論文投稿を目指す。その後、一般にモデルを広く公開するための準備を行う。また、時系列順序を認識するためのベースモデルも構築した。こちらのモデルもさらに洗練させ、モデル公開および、国際会議への論文投稿を目指す。 課題C「応用アプリケーション」については、課題Aの「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルをベースにしたデモアプリも試作した。改善の余地はあるものの、実際にユーザからテキストを受け付け、そこに含まれる地名・施設名を地図上に可視化する一連のシステムのプロトタイプは構築できた。さらなら応用を見据えて今後拡張していく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の課題A「テキスト情報と地理情報の相互作用を取り入れた新たな解析パラダイムの確立」に取り組んだ。すでにアノテーションの完了している「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルを構築し、一般にモデルを広く公開した。また、時系列順序を認識するためのベースモデルも構築した。改善の余地はあるが、ベースラインとして機能するシステムとなった。 課題Bに関連して、場所表現のアノテーションとそれらを経緯度に紐付けるアノテーションが完了した。本アノテーションデータセットを無償公開した。本データセットをベースにした論文は国内で賞も受賞し、研究者が広く使用可能な貴重なリソースに仕上がった。また、実際に著者が訪れた場所の認識とその時系列順序についてのアノテーション作業も完了した。基本的な統計情報やデータの性質を分析し、論文としてまとめているところである。 課題C「応用アプリケーション」に関連して、「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルをベースにしたデモアプリも試作した。改善の余地はあるものの、実際にユーザからテキストを受け付け、そこに含まれる地名・施設名を地図上に可視化する一連のシステムのプロトタイプは構築できた。
|
Strategy for Future Research Activity |
本研究の課題A「テキスト情報と地理情報の相互作用を取り入れた新たな解析パラダイムの確立」に取り組み、「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルを構築した。さらなる改良を重ね、国際会議への論文投稿を目指す。その後、モデルを広く公開するための準備を行う。また、時系列順序を認識するためのベースモデルも構築した。こちらのモデルもさらに洗練させ、モデル公開および、国際会議への論文投稿を目指す。 課題Bとして、旅行記中の著者が実際に訪れた場所を指す表現(場所表現)を、地図上の位置(経緯度)に時系列順に対応付けるアノテーション作業を完了した。これらは国内旅行記へのアノテーション作業であった。今後は海外旅行記も含めた、より多様なテキストを見据えたデータ構築へと移行する予定である。 課題C「応用アプリケーション」については、課題Aの「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルをベースにしたデモアプリも試作した。改善の余地はあるものの、実際にユーザからテキストを受け付け、そこに含まれる地名・施設名を地図上に可視化する一連のシステムのプロトタイプは構築できた。さらなら応用を見据えて今後拡張していく予定である。
|
Report
(1 results)
Research Products
(10 results)