2021 Fiscal Year Annual Research Report
Modality analysis of Japanese texts which are accessible to both of a real world and possible worlds
Project/Area Number |
18K11427
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
松吉 俊 東京工科大学, メディア学部, 講師 (10512163)
|
Co-Investigator(Kenkyū-buntansha) |
森 信介 京都大学, 学術情報メディアセンター, 教授 (90456773)
村脇 有吾 京都大学, 情報学研究科, 講師 (70616606)
亀甲 博貴 京都大学, 学術情報メディアセンター, 助教 (50827524)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | モダリティ解析 / コーパス / 日本語モダリティ / 将棋解説文 / シンボルグラウンディング / 様相論理 |
Outline of Annual Research Achievements |
本研究では、実世界と可能世界が参照可能であるテキストの日本語モダリティ解析システムを実装することを目標とした。本年度は研究の最終年度であるため、モダリティコーパスとモダリティ解析システムについて取りまとめを行った。 本研究で構築したモダリティコーパスは、9つの対局の将棋解説文データに対して、肯定の可能性、確実な否定、仮定などのモダリティ表現ラベル、断定、希望、複合辞などの事象クラスラベル、成立を断定、高い確信度で成立を推測、不成立を断定などの事実性ラベルを3階層にて付与した独創的なものである。コーパス構築に関するすべての知見を詳細にまとめ、その論文がジャーナル論文として採録された。コロナ禍であったため、当初計画していたコーパスの拡張は本年度も断念した。上記コーパスを学習データとして利用し実装したモダリティ解析システムは、最終的に、モダリティ表現、事象クラス、事実性に関してF値でそれぞれ0.84、0.81、0.83を達成した。BERTモデルを利用する手法、および、将棋固有表現も含めた4つの情報をマルチタスク学習する手法が有効であることを明らかにした。 本研究では、予測局面データ(可能世界)内に存在する事象群を自動判定し様相論理の応用によりモダリティ解析を実現する予定であった。しかしながら、ある局面に対象の事象が存在するか自動判定することは非常に難しいこと、および、プロの解説者のように状況に応じて探索空間を適切に絞ることが困難であることにより、研究はうまく進まなかった。その一方で、モダリティ表現付きの事象5,000個を利用した実験において、提案手法による事実性ラベル解析は、正解ラベルも既存のモダリティ辞書も利用しない手法であるが、正解率0.40という結果を得た。上記2つの困難を部分的にも解決することができれば、提案手法は事実性解析に有効である可能性があるということが分かった。
|