2024 Fiscal Year Research-status Report
述語論理に基づくデータベース照合による厳密かつ高精度・高速な事実検証システム
| Project/Area Number |
24K15066
|
| Research Institution | Hitotsubashi University |
Principal Investigator |
欅 惇志 一橋大学, 大学院ソーシャル・データサイエンス研究科, 准教授 (00733958)
|
| Co-Investigator(Kenkyū-buntansha) |
欅 リベカ (田中リベカ) 東京工科大学, コンピュータサイエンス学部, 助教 (30973903)
|
| Project Period (FY) |
2024-04-01 – 2027-03-31
|
| Keywords | 事実検証 / 述語論理 / 含意関係認識 / データベース照合 |
| Outline of Annual Research Achievements |
本研究では,情報(主張)の事実性を検証して,真偽の判定とその根拠を提示する事実検証に取り組み,述語論理に基づくデータベース照合による厳密かつ高精度・高速な事実検証システムを開発する.事実検証では,1. 真偽判定の根拠の候補となる文を大規模コーパスから取得,2. 根拠候補文を用いて真偽の判定,という流れが一般的である.既存研究では情報検索手法により主張と類似した文を根拠文として取得するが,その際に根拠文の再現率(網羅性)が低いことが課題となっている.また,深層学習手法による真偽の判定では,主張と根拠候補の整合性は厳密に考慮されていない.そこで本研究では,述語論理に基づく含意関係認識によって,文単位よりも細かい粒度での根拠の抽出と厳密な真偽判定を行う.また,既存の述語論理に基づく含意関係認識は大規模コーパスへの適用は想定されていないため,本研究では,データベース照合による含意関係認識を行うことで,述語論理に基づく厳密かつ高精度・高速な事実検証を実現する.本研究では,下記の3 点のリサーチ・クエスチョンを明らかにする. RQ1. データベース照合による定式化によって述語論理に基づく含意関係認識は可能か RQ2. 上記のアプローチによって厳密かつ高精度・高速な事実検証は可能か RQ3. 深層学習手法の適用によって提案アプローチの知識拡充(性能向上)は可能か 2024年度は述語論理式によるファクトデータベース構築に取り組んだ.その際に,主要な事実検証データセットであるFEVERを対象とした述語論理式変換が実施可能であるということを確認した.また,日本語の事実検証データセット構築にも取り組んでいる.具体的には,生成テキストからの主張分割データセットを構築した.本データセット構築が完了すれば,国内の事実検証研究促進に貢献できることが期待される.
|
| Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2024年度は述語論理式によるファクトデータベース構築に取り組む予定であったが,研究代表者の所属大学の公務が大きい年度と重なったため,現時点では,テキストデータを述語論理への変換ができることを確認できた状況である.
|
| Strategy for Future Research Activity |
2025年度は引き続き述語論理式によるファクトデータベース構築に取り組み,更に,データベース照合による含意関係認識に取り組む.また,既存のデータセットは英語のみを対象としているが,日本語データセット構築にも取り組む.主張分割は完了したため,根拠検索や事実検証に関するアノテーションを行う.
|
| Causes of Carryover |
共同研究者からの計算リソース提供に受けたため計算機の購入を見送ったため残額が生じた.2025年度助成金とあわせてデータアノテーションに使用する予定である.
|