• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

述語論理に基づくデータベース照合による厳密かつ高精度・高速な事実検証システム

Research Project

Project/Area Number 24K15066
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 61030:Intelligent informatics-related
Research InstitutionHitotsubashi University

Principal Investigator

欅 惇志  一橋大学, 大学院ソーシャル・データサイエンス研究科, 准教授 (00733958)

Co-Investigator(Kenkyū-buntansha) 欅 リベカ (田中リベカ)  東京工科大学, コンピュータサイエンス学部, 助教 (30973903)
Project Period (FY) 2024-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2026: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2025: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2024: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Keywords事実検証 / 述語論理 / 含意関係認識 / データベース照合
Outline of Research at the Start

本研究では,主張の事実性を検証し,真偽の判定とその根拠を提示する事実検証に取り組む.既存研究では情報検索手法により主張と類似した文を根拠文として取得するが,根拠文の再現率の低さが課題である.また,深層学習手法による真偽の判定では,主張と根拠候補の整合性は厳密に考慮されていない.本研究では,述語論理に基づく含意関係認識により,文単位より細かい粒度での根拠の抽出と厳密な真偽判定を行う.また,既存の述語論理に基づく含意関係認識は大規模コーパスへの適用は想定されていないため,本研究では,データベース照合による含意関係認識を行い,述語論理に基づく厳密かつ高精度・高速な事実検証を実現する.

Outline of Annual Research Achievements

本研究では,情報(主張)の事実性を検証して,真偽の判定とその根拠を提示する事実検証に取り組み,述語論理に基づくデータベース照合による厳密かつ高精度・高速な事実検証システムを開発する.事実検証では,1. 真偽判定の根拠の候補となる文を大規模コーパスから取得,2. 根拠候補文を用いて真偽の判定,という流れが一般的である.既存研究では情報検索手法により主張と類似した文を根拠文として取得するが,その際に根拠文の再現率(網羅性)が低いことが課題となっている.また,深層学習手法による真偽の判定では,主張と根拠候補の整合性は厳密に考慮されていない.そこで本研究では,述語論理に基づく含意関係認識によって,文単位よりも細かい粒度での根拠の抽出と厳密な真偽判定を行う.また,既存の述語論理に基づく含意関係認識は大規模コーパスへの適用は想定されていないため,本研究では,データベース照合による含意関係認識を行うことで,述語論理に基づく厳密かつ高精度・高速な事実検証を実現する.本研究では,下記の3 点のリサーチ・クエスチョンを明らかにする.
RQ1. データベース照合による定式化によって述語論理に基づく含意関係認識は可能か
RQ2. 上記のアプローチによって厳密かつ高精度・高速な事実検証は可能か
RQ3. 深層学習手法の適用によって提案アプローチの知識拡充(性能向上)は可能か
2024年度は述語論理式によるファクトデータベース構築に取り組んだ.その際に,主要な事実検証データセットであるFEVERを対象とした述語論理式変換が実施可能であるということを確認した.また,日本語の事実検証データセット構築にも取り組んでいる.具体的には,生成テキストからの主張分割データセットを構築した.本データセット構築が完了すれば,国内の事実検証研究促進に貢献できることが期待される.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

2024年度は述語論理式によるファクトデータベース構築に取り組む予定であったが,研究代表者の所属大学の公務が大きい年度と重なったため,現時点では,テキストデータを述語論理への変換ができることを確認できた状況である.

Strategy for Future Research Activity

2025年度は引き続き述語論理式によるファクトデータベース構築に取り組み,更に,データベース照合による含意関係認識に取り組む.また,既存のデータセットは英語のみを対象としているが,日本語データセット構築にも取り組む.主張分割は完了したため,根拠検索や事実検証に関するアノテーションを行う.

Report

(1 results)
  • 2024 Research-status Report
  • Research Products

    (6 results)

All 2025 2024

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (3 results)

  • [Journal Article] Building Test Collections for Japanese Dense Information Retrieval Technologies and Beyond2024

    • Author(s)
      Hideo Joho, Atsushi Keyaki, Yuuki Tachioka and Shuhei Yamamoto
    • Journal Title

      joint proceedings of the SIGIR-AP 2024 workshops EMTCIR 2024 and UM-CIR 2024

      Volume: なし

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Estimating Citizen Personality Traits Using Social Media Posts2024

    • Author(s)
      Taisei Iwasaki, Yohei Seki, Wakako Kashino, Atsushi Keyaki and Noriko Kando
    • Journal Title

      proceedings of the 26th International Conference on Asia-Pacific Digital Libraries (ICADL 2024)

      Volume: なし Pages: 119-135

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Coarse-Tuning for Ad-hoc Document Retrieval Using Pre-trained Language Models2024

    • Author(s)
      Atsushi Keyaki and Ribeka Keyaki
    • Journal Title

      proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)

      Volume: なし Pages: 3413-3421

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] 株式掲示板テキストを活用したリターン予測における独立成分分析を利用した解釈性の向上2025

    • Author(s)
      中島 秀太,欅 惇志,渡部 敏明,小町 守
    • Organizer
      言語処理学会第31回年次大会 (NLP2025)
    • Related Report
      2024 Research-status Report
  • [Presentation] 構成要素に注目した囲碁解説文の分類と生成2025

    • Author(s)
      西村 鷹和,欅 惇志,関 洋平
    • Organizer
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM2025)
    • Related Report
      2024 Research-status Report
  • [Presentation] 企業レポート中の ESG に関する公約の検証可能性の判別2025

    • Author(s)
      朱 博せん,関 洋平,欅 惇志,柏野 和佳子,神門 典子
    • Organizer
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM2025)
    • Related Report
      2024 Research-status Report

URL: 

Published: 2024-04-05   Modified: 2025-12-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi