• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

事実確認支援のための言説と統計データとの整合性検証による根拠提供

研究課題

研究課題/領域番号 23K11342
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分62020:ウェブ情報学およびサービス情報学関連
研究機関京都産業大学

研究代表者

宮森 恒  京都産業大学, 情報理工学部, 教授 (90287988)

研究期間 (年度) 2023-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード統計データ検索 / 大規模言語モデル / 文書補強 / クエリ拡張 / 表データ / 階層構造 / 表現学習 / 情報検索 / 事実確認 / 整合性検証 / 根拠 / 統計データ / 自然言語
研究開始時の研究の概要

本研究では、ネット上などに存在する事実確認(ファクトチェック)の対象となる言説に対して、政府統計などで公開される統計データとの整合性の有無を検証することにより、従来の自然言語処理だけでは得られない事実確認に有用な根拠を提供する研究を行う。本研究により、個人が接するさまざまな情報に対して、よりファクトチェックしやすい環境を整備することにつながり、偽情報などに対するメディアリテラシーの涵養に資することが期待される。

研究実績の概要

言説に関連した統計データの検索については,大規模言語モデルによる文書補強とリランキングによる統計データのアドホック検索手法を提案し検証を進めた.具体的には,統計データの内容説明を大規模言語モデルで生成しメタデータを補強した文書を作成し,大規模言語モデルを用いたクエリ拡張とリランキングを行う手法の性能を検証した.実験において,メタデータのみを文書としたBM25によるランキングと,リランキングを行う前後のランキング結果を比較したところ,クエリ拡張や文書補強によりランキング性能が低下すること,また,Pairwise Ranking Promptingによるリランキングはある程度ランキングを改善できることが確認された.一方,誤り分析の結果,実験で採用したデータセットの一部に適切な関連性スコアが付与されておらず,正解データの妥当性に不備がある可能性があることが判明した.
次に,統計データ内の関連箇所の抽出については,与えられたテキストに対して,それに関連する表中のセルを回答するタスクに取り組んだ.具体的には,表に含まれる階層的な情報を二次元座標木と呼ばれるツリーベースの構造で表現する従来手法が,必ずしも適切に構造を表現できない課題を改善した手法を提案し,性能を検証した.実験では,提案手法は,表が複雑な階層構造を有している際に特に従来手法と比較して良好な結果となることがわかった.また,日付に該当するセルは,セルタイプ分類タスクでは貢献度が大きいものの,表とテキストの関連付けタスクでは手掛かりとし有用でないことが確認できた.
最後に,関連箇所との整合性有無の判定については,データセット整備と実験に向けての基礎的な検討を進めた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

まず,言説に関連した統計データの検索については,当初の計画通り,言説からの適切なクエリ生成や、検索される統計データのデータ補強,リランキングを大規模言語モデルを活用した統計データ検索手法を提案し,その基本的な性能を確認しているため.
次に,統計データ内の関連箇所の抽出については,当初の計画通り,対象となる言説に関連する箇所を統計データから抽出する手法を提案し,その基本的な性能を確認しているため.
最後に,関連箇所との整合性有無の判定については,当初の計画通り,実験を実施するためのデータセット構築の検討作業を進めているため.

今後の研究の推進方策

まず,言説に関連した統計データの検索については,実験で採用したデータセットの一部の不備について状況を調査の上,適宜問題のある箇所を補強する作業を進め,その上で改めて提案手法を検証する必要がある.
次に,統計データ内の関連箇所の抽出については,誤り分析を進め,現在のモデルを改良するか新たなモデルを構築することで,より的確に関連箇所を取得し,整合性検証につなげられることを目指す.
最後に,関連箇所との整合性有無の判定については,実験を実施するためのデータセットを構築し,手法の性能分析や課題の明確化などについて検討を進める必要がある.

報告書

(1件)
  • 2023 実施状況報告書
  • 研究成果

    (17件)

すべて 2024 2023

すべて 学会発表 (17件) (うち国際学会 1件)

  • [学会発表] 対照学習による慣用句を考慮した文埋め込みの獲得2024

    • 著者名/発表者名
      中岡 知己, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 命題論理における言語の構成性に着目した言語モデルの汎化能力の調査2024

    • 著者名/発表者名
      井上 綾介, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 大規模言語モデルによる文書補強とリランキングによる統計データ検索2024

    • 著者名/発表者名
      黒川 博生, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 視覚情報と知識を利用したマルチモーダル対話における曖昧な言語指示対象の同定2024

    • 著者名/発表者名
      石井 里奈, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] ExhaustiveTree: 網羅的な二次元座標木を用いた表の表現2024

    • 著者名/発表者名
      林 知司, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 数個の発話と疑似文脈生成に基づくキャラクタ対話応答生成2024

    • 著者名/発表者名
      福岡 啓人, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 性格による応答の多様性を考慮したキャラクタ対話データセット構築2024

    • 著者名/発表者名
      村田 樹, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] チャート画像に対する大規模マルチモーダルモデルの反実仮想推論能力の検証2024

    • 著者名/発表者名
      戸崎 友輔, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] HeavyOrdiNum-VL: 順序数を的確に把握し活用する視覚言語モデルの能力を探る2024

    • 著者名/発表者名
      増田 琉斗, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] HeavyOrdiNum-L: 順序数を的確に把握し活用する言語モデルの能力を探る2024

    • 著者名/発表者名
      林 寛治, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 汎用的検索に基づく視覚的なマルチホップ質問応答2024

    • 著者名/発表者名
      山野 瑞月, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 自然保護管理のための捕獲を目的とした鹿の行動パターンに基づく警戒度推定2024

    • 著者名/発表者名
      酒井 歩夢, 宮森 恒
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム DEIM2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] KSU at the NTCIR-17 UFO Task2023

    • 著者名/発表者名
      Tomokazu Hayashi, Hisashi Miyamori
    • 学会等名
      The 17th NTCIR Conference
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] BoxPlotQA: 箱ひげ図による五数要約と比較性能を測るための視覚的質問応答2023

    • 著者名/発表者名
      戸崎 友輔, 宮森 恒
    • 学会等名
      WebDB夏のワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 視覚言語モデルに関する順序数の的確な把握と活用能力の調査2023

    • 著者名/発表者名
      増田 琉斗, 宮森 恒
    • 学会等名
      WebDB夏のワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Transformerモデルに関する順序数の的確な把握と活用能力の調査2023

    • 著者名/発表者名
      林 寛治, 宮森 恒
    • 学会等名
      WebDB夏のワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] キャラクタの外見画像を考慮したキャラクタ性を付与した対話システム2023

    • 著者名/発表者名
      福岡 啓人, 宮森 恒
    • 学会等名
      WebDB夏のワークショップ2023
    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2023-04-13   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi