研究課題/領域番号 |
23K24904
|
補助金の研究課題番号 |
22H03648 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
大内 啓樹 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (70825463)
|
研究分担者 |
若宮 翔子 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (60727220)
松田 裕貴 岡山大学, 環境生命自然科学学域, 講師 (90809708)
進藤 裕之 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 特任准教授 (20734784)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
13,910千円 (直接経費: 10,700千円、間接経費: 3,210千円)
2024年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2023年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2022年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
|
キーワード | 自然言語処理 / 地理空間情報 / 地理情報システム / ジオコーディング / 実世界接地 / 地図 / 意味解析 / 記号接地 / 地名抽出 |
研究開始時の研究の概要 |
計算機によって文章中の人物の地理的な移動を読み取り、その移動軌跡を実世界の地図上に接地(グラウンディング)する問題に取り組む。この問題を通じて、テキストデータを移動軌跡データに変換および対応付けるシステムを構築し、時空間データ解析や地理情報科学など幅広い分野での応用を可能にする。その実現に向けて次の3つの課題に取り組む。課題A:テキスト情報と実世界地理情報の両方を取り入れた新たな解析パラダイムの提案。課題B:移動軌跡接地システムの学習・評価に用いるデータセットを構築する。課題C:観光経路推薦アプリケーションへの組み込みを通じて、移動軌跡接地システムの応用利用の方法論を探究する。
|
研究実績の概要 |
本研究の課題Bとして、旅行記中の著者が実際に訪れた場所を指す表現(場所表現)を、地図上の位置(経緯度)に時系列順に対応付ける。すでに場所表現のアノテーションとそれらを経緯度に紐付けるアノテーションは完了した。本アノテーションデータセットを無償公開した。本データセットをベースにした論文は国内で賞も受賞し、研究者が広く使用可能な貴重なリソースに仕上がった。また、実際に著者が訪れた場所の認識とその時系列順序についてのアノテーション作業も行った。本データセットの公開と、本データセットを元にした成果を論文にまとめて公開を目指す。 課題A「テキスト情報と地理情報の相互作用を取り入れた新たな解析パラダイムの確立」に取り組んだ。まず、すでにアノテーションの完了している「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルを構築した。さらなる改良を重ね、国際会議への論文投稿を目指す。その後、一般にモデルを広く公開するための準備を行う。また、時系列順序を認識するためのベースモデルも構築した。こちらのモデルもさらに洗練させ、モデル公開および、国際会議への論文投稿を目指す。 課題C「応用アプリケーション」については、課題Aの「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルをベースにしたデモアプリも試作した。改善の余地はあるものの、実際にユーザからテキストを受け付け、そこに含まれる地名・施設名を地図上に可視化する一連のシステムのプロトタイプは構築できた。さらなら応用を見据えて今後拡張していく予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の課題A「テキスト情報と地理情報の相互作用を取り入れた新たな解析パラダイムの確立」に取り組んだ。すでにアノテーションの完了している「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルを構築し、一般にモデルを広く公開した。また、時系列順序を認識するためのベースモデルも構築した。改善の余地はあるが、ベースラインとして機能するシステムとなった。 課題Bに関連して、場所表現のアノテーションとそれらを経緯度に紐付けるアノテーションが完了した。本アノテーションデータセットを無償公開した。本データセットをベースにした論文は国内で賞も受賞し、研究者が広く使用可能な貴重なリソースに仕上がった。また、実際に著者が訪れた場所の認識とその時系列順序についてのアノテーション作業も完了した。基本的な統計情報やデータの性質を分析し、論文としてまとめているところである。 課題C「応用アプリケーション」に関連して、「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルをベースにしたデモアプリも試作した。改善の余地はあるものの、実際にユーザからテキストを受け付け、そこに含まれる地名・施設名を地図上に可視化する一連のシステムのプロトタイプは構築できた。
|
今後の研究の推進方策 |
本研究の課題A「テキスト情報と地理情報の相互作用を取り入れた新たな解析パラダイムの確立」に取り組み、「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルを構築した。さらなる改良を重ね、国際会議への論文投稿を目指す。その後、モデルを広く公開するための準備を行う。また、時系列順序を認識するためのベースモデルも構築した。こちらのモデルもさらに洗練させ、モデル公開および、国際会議への論文投稿を目指す。 課題Bとして、旅行記中の著者が実際に訪れた場所を指す表現(場所表現)を、地図上の位置(経緯度)に時系列順に対応付けるアノテーション作業を完了した。これらは国内旅行記へのアノテーション作業であった。今後は海外旅行記も含めた、より多様なテキストを見据えたデータ構築へと移行する予定である。 課題C「応用アプリケーション」については、課題Aの「場所表現の認識」と「場所表現と経緯度の紐付け」を行うモデルをベースにしたデモアプリも試作した。改善の余地はあるものの、実際にユーザからテキストを受け付け、そこに含まれる地名・施設名を地図上に可視化する一連のシステムのプロトタイプは構築できた。さらなら応用を見据えて今後拡張していく予定である。
|