2017 Fiscal Year Research-status Report
世界モデルを用いたシミュレーションによる歴史テキスト理解
Project/Area Number |
16K00293
|
Research Institution | The University of Tokyo |
Principal Investigator |
鶴岡 慶雅 東京大学, 大学院情報理工学系研究科, 准教授 (50566362)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 自然言語理解 |
Outline of Annual Research Achievements |
本研究プロジェクトの目的は、世界史や日本史といった歴史的事象に関するテキストを理解・解釈することのできる計算機システムを実現することである。それを実現する方法として我々は、様々な歴史イベントを表現可能であり、自律的に時間発展する世界モデルを用いるというアプローチを提案している。昨年度は、歴史的人物の地点間の移動を、無向グラフによってモデル化し、シミュレーテッドアニーリング法により人物の移動経路をある程度推定できることが明らかになった。しかし同時に、テキストから情報を抽出する際の欠損値の扱いや、推定結果の不確実さを表現することの難しさも明らかになった。 それらの課題に対処するため、当該年度は、人物の地点間の移動を確率的現象としてとらえ、隠れマルコフモデルによってモデル化するアプローチの研究を行った。隠れマルコフモデルを用いることで、人物が各地点間を移動する確率や、各地点における人物の存在確率は、それぞれ、状態間の遷移確率および状態の周辺確率として自然にモデル化することが可能になる。 上記のアプローチの有効性を検証するため、日本語Wikipediaのテキストを利用して実験を行った。具体的には、日本の戦国時代の人物に関して、テキスト記述から人物の存在地点に関する断片的な情報を抽出し、それらを制約条件として、他の時点における存在確率を推定することとした。推定にはEMアルゴリズムの一種であるBaum-Welchアルゴリズムを用いた。実験の結果,データ不足に起因する偏りはあるものの、地点間の遷移確率および各時点における人物の存在確率をある程度推定できることが明らかになった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
自然言語を理解するための世界モデルとして、どのようなモデルを用いるべきかということは本プロジェクトにおける非常に大きな問題であった。当該年度の研究により、隠れマルコフモデルのような確率的生成モデルを利用することの有効性がある程度明らかになったのは、本研究プロジェクトを進めるうえで重要なマイルストーンとなった。
|
Strategy for Future Research Activity |
当該年度は、人物の地点間の移動というイベントに着目して研究を行った。今後は、扱うイベントの種類を増やすことによって、テキストに記述されている様々な情報をモデル化することが目標である。
|
Causes of Carryover |
物品購入に必要な経費が想定を下回ったために次年度使用額が生じた。次年度に予定する物品費と合わせて使用する計画である。
|
Research Products
(1 results)