• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文章中の人物の移動軌跡を実世界の地図上に接地するための基礎研究とその応用

Research Project

Project/Area Number 23K24904
Project/Area Number (Other) 22H03648 (2022-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2022-2023)
Section一般
Review Section Basic Section 61030:Intelligent informatics-related
Research InstitutionNara Institute of Science and Technology

Principal Investigator

大内 啓樹  奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (70825463)

Co-Investigator(Kenkyū-buntansha) 若宮 翔子  奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (60727220)
松田 裕貴  岡山大学, 環境生命自然科学学域, 講師 (90809708)
進藤 裕之  奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 特任准教授 (20734784)
Project Period (FY) 2024-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥13,910,000 (Direct Cost: ¥10,700,000、Indirect Cost: ¥3,210,000)
Fiscal Year 2024: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2023: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2022: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Keywords自然言語処理 / 地理空間情報 / 実世界接地 / 地図 / 地理情報システム / ジオコーディング / 意味解析 / 記号接地 / 地名抽出
Outline of Research at the Start

計算機によって文章中の人物の地理的な移動を読み取り、その移動軌跡を実世界の地図上に接地(グラウンディング)する問題に取り組む。この問題を通じて、テキストデータを移動軌跡データに変換および対応付けるシステムを構築し、時空間データ解析や地理情報科学など幅広い分野での応用を可能にする。その実現に向けて次の3つの課題に取り組む。課題A:テキスト情報と実世界地理情報の両方を取り入れた新たな解析パラダイムの提案。課題B:移動軌跡接地システムの学習・評価に用いるデータセットを構築する。課題C:観光経路推薦アプリケーションへの組み込みを通じて、移動軌跡接地システムの応用利用の方法論を探究する。

Outline of Annual Research Achievements

本研究では、自然言語で記述された文章から筆者の地理的な移動軌跡を抽出し、実世界の地図上に再現するAI技術の開発を目的としている。これにより、テキストに内在する時空間的情報を構造化し、人文地理学や地理情報科学など多分野に貢献する新たな情報処理基盤の確立を目指す。
2023年度までに、文章中の地名や施設名の抽出、およびそれらの訪問地を時系列順にアノテーションしたデータセットを整備しており、本年度はこのデータセットを活用して、著者の訪問地の順序を推定するモデルの開発および評価に取り組んだ。BERTや大規模言語モデルを用いて、文脈的手がかりを活用したベースラインモデルを構築した。さらに、複数のモデルを比較し、誤り傾向の分析を行った。特に、地理的な階層関係の認識に大きな課題があることが明らかとなった。これにより、今後のモデル改良やデータ拡張の方針に関する有用な知見が得られた。
現在、本成果をもとに論文を執筆し、査読付き国際会議に投稿済みである。今後、採択後の公開を見据え、モデルおよび分析コードの整備と再現性確保に向けた準備を進めている。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究では、自然言語で記述された文章から人の移動軌跡を読み取り、それを地図上に再現するためのAI技術の開発を進めてきた。これまでに、場所を表す言語表現の抽出や位置情報との対応付けに関する基礎技術を確立させ、現在はその応用・実装段階に差しかかっている。
2023年度までの段階では、文章中に登場する地名や施設名を高精度に抽出し、それらを地図上の具体的な緯度・経度座標と対応づけるためのデータセットおよび機械学習モデルを構築した。これらの成果を活用し、入力された文章から地図上に軌跡を描画する実働システムの開発を完了している。
2024年度には、これに加えて、文章の筆者が訪れた場所を時系列に整序する技術の開発に取り組んだ。具体的には、時系列情報のアノテーションを含む新たなデータセットを構築し、それを活用したベースラインモデルの設計と実装を行った。この成果を基に学術論文を執筆し、現在、査読付きの国際会議に投稿し、採択結果を待っている段階である。
さらに、今後の研究の発展と再現性の確保を目的として、構築したデータセットを研究目的に限り広く公開するための準備も進めている。また、開発したモデルについても、オープンソースとしての公開を目指し、精度および汎用性の向上に向けた継続的な改良を重ねている。

Strategy for Future Research Activity

今後の研究では、これまでに得られた成果を踏まえ、三つの観点から本研究をより実践的かつ学術的に発展させていく方針である。
第一に、文章中の地理的移動軌跡を地図上に接地する技術を応用し、一般ユーザにも利用可能な実働システムの開発を行う。具体的には、任意の文章を入力として受け取り、その中に記述された訪問地や移動の順序を解析し、地図上に軌跡として可視化するインタフェースを整備する。本システムは研究者や教育関係者による活用を想定し、誰でも利用可能な形でオープンソースとして公開することで、再現性の高い研究の基盤を提供することを目指す。
第二に、このシステムを用いて、従来十分に構造化されてこなかった人文地理学や国際関係論などの領域におけるテキスト資料を解析対象とし、これらの分野における新たなテキスト分析手法の創出に貢献する。とりわけ、旅行記や外交文書など、空間的・時間的情報が豊富に含まれるテキストを対象とし、学際的連携のもとで応用実験を展開する。
第三に、現在構築済みのデータセットは高品質である一方で、データ量の点では限定的であった。今後は、より大規模な学習・評価環境を整備するため、クラウドソーシングの活用によるアノテーション作業の拡張や、大規模言語モデル(LLM)を活用した自動アノテーション手法の導入を検討している。これにより、より汎用的かつ実用性の高い軌跡接地技術の確立を目指す。

Report

(3 results)
  • 2024 Research-status Report
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • Research Products

    (31 results)

All 2025 2024 2023 2022

All Journal Article (21 results) (of which Peer Reviewed: 5 results,  Open Access: 20 results) Presentation (10 results) (of which Int'l Joint Research: 1 results,  Invited: 2 results)

  • [Journal Article] A Text Embedding Model with Contrastive Example Mining for Point-of-Interest Geocoding2025

    • Author(s)
      Hibiki Nakatani, Hiroki Teranishi, Shohei Higashiyama, Yuya Sawada, Hiroki Ouchi, Taro Watanabe
    • Journal Title

      Proceedings of the 31st International Conference on Computational Linguistics

      Volume: - Pages: 7279-7291

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 大規模言語モデルを用いた発掘調査報告書からの考古学情報抽出2025

    • Author(s)
      山本 湧大, 武内 樹治, 大内 啓樹, 高田 祐一
    • Journal Title

      言語処理学会第31回年次大会発表論文集

      Volume: -

    • Related Report
      2024 Research-status Report
    • Open Access
  • [Journal Article] 近世・近代・現代日本語テキストに対する場所参照表現抽出2025

    • Author(s)
      片山 歩希, 東山 翔平, 大内 啓樹, 坂井 優介, 竹内 綾乃, 坂東 諒, 橋本 雄太, 小木曽 智信, 渡辺 太郎
    • Journal Title

      言語処理学会第31回年次大会発表論文集

      Volume: -

    • Related Report
      2024 Research-status Report
    • Open Access
  • [Journal Article] 日英対訳ジオパージングデータセットATD-Para2025

    • Author(s)
      東山 翔平, 大内 啓樹, 藤田 篤, 内山 将夫
    • Journal Title

      言語処理学会第31回年次大会発表論文集

      Volume: -

    • Related Report
      2024 Research-status Report
    • Open Access
  • [Journal Article] Wikidataに基づく大規模ジオコーディングデータセット2025

    • Author(s)
      中谷 響, 安井 雄一郎, 若本 亮佑, 石井 昌之, 大内 啓樹, 渡辺 太郎
    • Journal Title

      言語処理学会第31回年次大会発表論文集

      Volume: -

    • Related Report
      2024 Research-status Report
    • Open Access
  • [Journal Article] Evaluating Language Models in Location Referring Expression Extraction from Early Modern and Contemporary Japanese Texts2024

    • Author(s)
      Katayama Ayuki、Sakai Yusuke、Higashiyama Shohei、Ouchi Hiroki、Takeuchi Ayano、Bando Ryo、Hashimoto Yuta、Ogiso Toshinobu、Watanabe Taro
    • Journal Title

      Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities

      Volume: - Pages: 331-338

    • DOI

      10.18653/v1/2024.nlp4dh-1.33

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Constructing Indonesian-English Travelogue Dataset2024

    • Author(s)
      Eunike Kardinata, Hiroki Ouchi, and Taro Watanabe
    • Journal Title

      Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)

      Volume: - Pages: 3759-3771

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] A PoI Localization Method using Time-series SNS Posts with Photos2024

    • Author(s)
      Kohei Sawano, Yuki Matsuda, Hiroki Ouchi, Hirohiko Suwa, Keiichi Yasumoto
    • Journal Title

      IEICE Technical Report; IEICE Tech. Rep.

      Volume: 123

    • Related Report
      2024 Research-status Report
  • [Journal Article] 書き手はどこを訪れたか? -言語モデルで訪問行動を読み取る-2024

    • Author(s)
      大友 寛之,大内 啓樹,東山 翔平,寺西 裕紀,山本 和太郎,進藤 裕之,渡辺 太郎
    • Journal Title

      第33回地理情報システム学会学術研究発表大会

      Volume: -

    • Related Report
      2024 Research-status Report
    • Open Access
  • [Journal Article] Arukikata Travelogue Dataset with Geographic Entity Mention, Coreference, and Link Annotation2024

    • Author(s)
      Shohei Higashiyama, Hiroki Ouchi, Hiroki Teranishi, Hiroyuki Otomo, Yusuke Ide, Aitaro Yamamoto, Hiroyuki Shindo, Yuki Matsuda, Shoko Wakamiya, Naoya Inoue, Ikuya Yamada, Taro Watanabe
    • Journal Title

      Findings of the Association for Computational Linguistics: EACL 2024

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Detecting Careless Responses in Dataset Annotation using Screen Operation Logs2024

    • Author(s)
      Yoshinobu Fukumitsu, Yuki Matsuda, Hirohiko Suwa, Keiichi Yasumoto
    • Journal Title

      IEEE International Conference on Pervasive Computing and Communications Workshops and other Affiliated Events (PerCom Workshops, TRUSTSENSE)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 移動軌跡解析:文章中の人物の地理的な移動を読み取る2024

    • Author(s)
      山本和太郎,大友寛之,大内啓樹,東山翔平,寺西裕紀,進藤裕之,渡辺太郎
    • Journal Title

      言語処理学会第30回年次大会 (NLP2024)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] メンション文脈とエントリ属性を考慮した Transformer Bi-Encoder によるジオコーディング2024

    • Author(s)
      中谷響,寺西裕紀,東山翔平,大内啓樹,渡辺太郎
    • Journal Title

      言語処理学会第30回年次大会 (NLP2024)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 日本語旅行記ジオパージングデータセット ATD-MCL2024

    • Author(s)
      東山翔平,大内啓樹,寺西裕紀,大友寛之,井手佑翼,山本和太郎,進藤裕之,渡辺太郎
    • Journal Title

      言語処理学会第30回年次大会 (NLP2024)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] クラウドソーシングでの固有表現アノテーションにおける不良回答の検出2024

    • Author(s)
      福光嘉伸,松田裕貴,諏訪博彦,安本慶一
    • Journal Title

      福光嘉伸,松田裕貴,諏訪博彦,安本慶一

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 写真付き時系列SNS投稿データを用いたPoI位置推定手法の検討2023

    • Author(s)
      澤野耕平,松田裕貴,大内啓樹,諏訪博彦,安本慶一
    • Journal Title

      電子情報通信学会技術研究報告 センサネットワークとモバイルインテリジェンス研究会(SeMI)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 固有表現アノテーションにおける画面操作記録を用いた不良回答検出2023

    • Author(s)
      福光嘉伸,松田裕貴,諏訪博彦,安本慶一
    • Journal Title

      情報処理学会ヒューマンコンピュータインタラクション(HCI)研究会

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 歴史災害史料からの自動地名抽出に向けた自然言語処理システムの性能評価2023

    • Author(s)
      武内 樹治,大内啓樹,東山翔平
    • Journal Title

      人文科学とコンピュータシンポジウム2023 (じんもんこん2023)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 歴史的日本語資料を対象とした場所参照表現抽出ー「おくのほそ道」を例としてー2023

    • Author(s)
      片山歩希,東山翔平,大内啓樹,渡辺太郎
    • Journal Title

      第25回音声言語シンポジウム兼第10回自然言語処理シンポジウム (第258回 自然言語処理研究発表会)

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 文章から地理空間を取り出すー場所を表す言語表現の抽出と地図データベースへの接続ー2023

    • Author(s)
      大内啓樹,中谷響,東山翔平,寺西裕紀,渡辺太郎
    • Journal Title

      第32回地理情報システム学会学術研究発表大会

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] 移動軌跡可視化のための旅行記への訪問順序アノテーション2023

    • Author(s)
      山本和太郎,東山翔平,大内啓樹,大友寛之,井手佑翼,進藤裕之,渡辺太郎
    • Journal Title

      2023年度人工知能学会全国大会

      Volume: -

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Presentation] ツイート発言の座標またはグリッドの予測基盤の開発2023

    • Author(s)
      大西 駿太朗, 矢田 竣太郎, 若宮 翔子, 荒牧 英治
    • Organizer
      言語処理学会 第29回年次大会 (NLP2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 震災アーカイブと震災アーカイブwebに関する概念モデルの作成2023

    • Author(s)
      齋藤玲, 大内啓樹, 羽鳥康裕, 邑本俊亮, 杉浦元亮, 塩入諭, 柴山明寛
    • Organizer
      言語処理学会第29回年次大会 (NLP2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 場所参照表現と位置情報を紐付けるジオコーディングの概観と発展に向けての考察2023

    • Author(s)
      久本空海, 西尾悟, 井口奏大, 古川泰人, 大友寛之, 東山翔平, 大内啓樹
    • Organizer
      言語処理学会第29回年次大会 (NLP2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 旅行記中の場所に対する訪問状態の予測2023

    • Author(s)
      大友寛之, 東山翔平, 大内啓樹, 山本和太郎, 井手佑翼, 進藤裕之, 渡辺太郎
    • Organizer
      言語処理学会第29回年次大会 (NLP2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 地球の歩き方旅行記データセット2023

    • Author(s)
      大内啓樹, 進藤裕之, 若宮翔子, 松田裕貴, 井之上直也, 東山翔平, 中村哲, 渡辺太郎
    • Organizer
      言語処理学会第29回年次大会 (NLP2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 地球の歩き方旅行記データセット -文章中の人物の移動軌跡を実世界の地図上に接地する-2023

    • Author(s)
      大内啓樹
    • Organizer
      デジタルアーカイブ学会 産業とデータ・コンテンツ部会第 9 回 DA ショートトーク
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] Geosocial Media Data Analysis and Applications2022

    • Author(s)
      Shoko Wakamiya
    • Organizer
      The 19th International Symposium on Web and Wireless Geographical Information Systems (W2GIS 2022)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] 車載動画キュレーションのための観光地らしさ推定モデルの構築2022

    • Author(s)
      河中昌樹,松田裕貴,諏訪博彦,安本慶一
    • Organizer
      第29回社会情報システム学シンポジウム(ISS29)
    • Related Report
      2022 Annual Research Report
  • [Presentation] ドライブレコーダを用いたメモリアル経路動画キュレーションのための"観光地らしさ"の再考2022

    • Author(s)
      河中昌樹,松田裕貴,諏訪博彦,安本慶一
    • Organizer
      第30回マルチメディア通信と分散処理ワークショップ(DPSWS2022)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 旅行者の移動軌跡を地図上に描くための訪問順序アノテーション2022

    • Author(s)
      山本和太郎, 東山翔平, 大友寛之, 大内啓樹, 渡辺太郎
    • Organizer
      NLP若手の会 (YANS) 第17回シンポジウム
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-04-19   Modified: 2025-12-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi