• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Research-status Report

世界モデルを用いたシミュレーションによる歴史テキスト理解

Research Project

Project/Area Number 16K00293
Research InstitutionThe University of Tokyo

Principal Investigator

鶴岡 慶雅  東京大学, 大学院情報理工学系研究科, 准教授 (50566362)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywords自然言語理解
Outline of Annual Research Achievements

本研究プロジェクトの目的は、世界史や日本史といった歴史的事象に関するテキストを理解・解釈することのできる計算機システムを実現することである。それを実現する方法として我々は、様々な歴史イベントを表現可能であり、自律的に時間発展する世界モデルを用いるというアプローチを提案している。昨年度は、歴史的人物の地点間の移動を、無向グラフによってモデル化し、シミュレーテッドアニーリング法により人物の移動経路をある程度推定できることが明らかになった。しかし同時に、テキストから情報を抽出する際の欠損値の扱いや、推定結果の不確実さを表現することの難しさも明らかになった。
それらの課題に対処するため、当該年度は、人物の地点間の移動を確率的現象としてとらえ、隠れマルコフモデルによってモデル化するアプローチの研究を行った。隠れマルコフモデルを用いることで、人物が各地点間を移動する確率や、各地点における人物の存在確率は、それぞれ、状態間の遷移確率および状態の周辺確率として自然にモデル化することが可能になる。
上記のアプローチの有効性を検証するため、日本語Wikipediaのテキストを利用して実験を行った。具体的には、日本の戦国時代の人物に関して、テキスト記述から人物の存在地点に関する断片的な情報を抽出し、それらを制約条件として、他の時点における存在確率を推定することとした。推定にはEMアルゴリズムの一種であるBaum-Welchアルゴリズムを用いた。実験の結果,データ不足に起因する偏りはあるものの、地点間の遷移確率および各時点における人物の存在確率をある程度推定できることが明らかになった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

自然言語を理解するための世界モデルとして、どのようなモデルを用いるべきかということは本プロジェクトにおける非常に大きな問題であった。当該年度の研究により、隠れマルコフモデルのような確率的生成モデルを利用することの有効性がある程度明らかになったのは、本研究プロジェクトを進めるうえで重要なマイルストーンとなった。

Strategy for Future Research Activity

当該年度は、人物の地点間の移動というイベントに着目して研究を行った。今後は、扱うイベントの種類を増やすことによって、テキストに記述されている様々な情報をモデル化することが目標である。

Causes of Carryover

物品購入に必要な経費が想定を下回ったために次年度使用額が生じた。次年度に予定する物品費と合わせて使用する計画である。

  • Research Products

    (1 results)

All 2018

All Presentation (1 results)

  • [Presentation] 隠れマルコフモデルによる歴史テキストの人物移動のモデル化2018

    • Author(s)
      水谷 陽太
    • Organizer
      2018年度 人工知能学会全国大会

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi