2020 Fiscal Year Research-status Report
実世界と可能世界が参照可能であるテキストの日本語モダリティ解析
Project/Area Number |
18K11427
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
松吉 俊 電気通信大学, 大学院情報理工学研究科, 助教 (10512163)
|
Co-Investigator(Kenkyū-buntansha) |
森 信介 京都大学, 学術情報メディアセンター, 教授 (90456773)
村脇 有吾 京都大学, 情報学研究科, 講師 (70616606)
亀甲 博貴 京都大学, 学術情報メディアセンター, 助教 (50827524)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | モダリティ解析 / コーパス / 日本語モダリティ / 将棋解説文 / シンボルグラウンディング |
Outline of Annual Research Achievements |
本研究では、実世界と可能世界が参照可能であるテキストの日本語モダリティ解析システムを実装する。具体的には将棋解説文データを研究に利用する。このデータは、将棋局面のデータ(実世界)、現在の局面に対する解説テキストデータ、現在の局面に対する先読みアルゴリズムによる予測局面データ(可能世界)の3つで構成される。本年度はコロナ禍のため、計画通りに研究を進めることができなかった。本年度は、日本語モダリティ表現のグラウンディングに関する研究のみ実施した。 「可能性がある」や「に違いない」などの日本語モダリティ表現は、「明日雨が降る」や「彼がケーキを食べた」などの事象に対する情報発信者の確信度を表明するために使用される。論理学の様相論理においては、「可能性としてありうる世界」の集合を考慮し、それら可能世界のどの程度で対象の事象が真であるかを測ることにより、事象に付加されたモダリティ表現の意味を定義する。本研究で利用する予測局面データはまさに可能世界の集合であり、将棋解説文内で言及される事象がそのような可能世界のどの程度で真であるか、すなわち、実際にいくつの局面に現れたかを測ることにより、事象に付加されたモダリティ表現の意味(確信度の強さ)を推定することができる。本研究では、このタスクをモダリティ表現のグラウンディングタスクと呼ぶ。本年度は、将棋解説文データからモダリティ表現付きの事象を約5,000個抽出してモダリティ表現のグラウンディングを試行し、それぞれのモダリティ表現に対して確信度スコアを算出することができた。今後の課題として、予測アルゴリズムの使用方法に工夫を加えることで人間の直感と相関のある確信度スコアとなるよう改善する必要があることが分かった。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本年度はコロナ禍のため、研究に協力してくれる学生の確保が難しかったり、教員が本業のほうに多くのエフォートを取られてしまったりしたため、最終年度ではあったが、当初の計画通りに研究を進めることができなかった。 事業期間延長申請が承認されたので、来年度に2020年度に計画していた研究を遂行する所存である。
|
Strategy for Future Research Activity |
事業期間延長申請による本研究課題の最終年度であるので、これまでのすべての成果物を活用し、実世界と可能世界が参照可能であるテキストの日本語モダリティ解析の高精度化を目指す。具体的には、局面データと予測局面データを利用したモダリティ表現のグラウンディングタスクの精度を上げ、通常のモダリティ解析にその結果を応用する。
|
Causes of Carryover |
コロナ禍であったため、当初の計画通りに旅費や謝金を支出することができなかった。 次年度は事業期間延長申請が承認された本研究課題の最終年度であり、構築したシステムの評価を実施する。このうち、イベントのシンボルグラウンディングが正確にできているかの評価には人手による判断が必要であり、技術補佐員を雇用しこのタスクに割り当てる予定である。
|