| 研究課題/領域番号 |
24K15066
|
| 研究種目 |
基盤研究(C)
|
| 配分区分 | 基金 |
| 応募区分 | 一般 |
| 審査区分 |
小区分61030:知能情報学関連
|
| 研究機関 | 一橋大学 |
研究代表者 |
欅 惇志 一橋大学, 大学院ソーシャル・データサイエンス研究科, 准教授 (00733958)
|
| 研究分担者 |
欅 リベカ (田中リベカ) 東京工科大学, コンピュータサイエンス学部, 助教 (30973903)
|
| 研究期間 (年度) |
2024-04-01 – 2027-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2026年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2025年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2024年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
| キーワード | 事実検証 / 述語論理 / 含意関係認識 / データベース照合 |
| 研究開始時の研究の概要 |
本研究では,主張の事実性を検証し,真偽の判定とその根拠を提示する事実検証に取り組む.既存研究では情報検索手法により主張と類似した文を根拠文として取得するが,根拠文の再現率の低さが課題である.また,深層学習手法による真偽の判定では,主張と根拠候補の整合性は厳密に考慮されていない.本研究では,述語論理に基づく含意関係認識により,文単位より細かい粒度での根拠の抽出と厳密な真偽判定を行う.また,既存の述語論理に基づく含意関係認識は大規模コーパスへの適用は想定されていないため,本研究では,データベース照合による含意関係認識を行い,述語論理に基づく厳密かつ高精度・高速な事実検証を実現する.
|
| 研究実績の概要 |
本研究では,情報(主張)の事実性を検証して,真偽の判定とその根拠を提示する事実検証に取り組み,述語論理に基づくデータベース照合による厳密かつ高精度・高速な事実検証システムを開発する.事実検証では,1. 真偽判定の根拠の候補となる文を大規模コーパスから取得,2. 根拠候補文を用いて真偽の判定,という流れが一般的である.既存研究では情報検索手法により主張と類似した文を根拠文として取得するが,その際に根拠文の再現率(網羅性)が低いことが課題となっている.また,深層学習手法による真偽の判定では,主張と根拠候補の整合性は厳密に考慮されていない.そこで本研究では,述語論理に基づく含意関係認識によって,文単位よりも細かい粒度での根拠の抽出と厳密な真偽判定を行う.また,既存の述語論理に基づく含意関係認識は大規模コーパスへの適用は想定されていないため,本研究では,データベース照合による含意関係認識を行うことで,述語論理に基づく厳密かつ高精度・高速な事実検証を実現する.本研究では,下記の3 点のリサーチ・クエスチョンを明らかにする. RQ1. データベース照合による定式化によって述語論理に基づく含意関係認識は可能か RQ2. 上記のアプローチによって厳密かつ高精度・高速な事実検証は可能か RQ3. 深層学習手法の適用によって提案アプローチの知識拡充(性能向上)は可能か 2024年度は述語論理式によるファクトデータベース構築に取り組んだ.その際に,主要な事実検証データセットであるFEVERを対象とした述語論理式変換が実施可能であるということを確認した.また,日本語の事実検証データセット構築にも取り組んでいる.具体的には,生成テキストからの主張分割データセットを構築した.本データセット構築が完了すれば,国内の事実検証研究促進に貢献できることが期待される.
|
| 現在までの達成度 |
現在までの達成度
3: やや遅れている
理由
2024年度は述語論理式によるファクトデータベース構築に取り組む予定であったが,研究代表者の所属大学の公務が大きい年度と重なったため,現時点では,テキストデータを述語論理への変換ができることを確認できた状況である.
|
| 今後の研究の推進方策 |
2025年度は引き続き述語論理式によるファクトデータベース構築に取り組み,更に,データベース照合による含意関係認識に取り組む.また,既存のデータセットは英語のみを対象としているが,日本語データセット構築にも取り組む.主張分割は完了したため,根拠検索や事実検証に関するアノテーションを行う.
|