• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Research on AI's reading comprehension of multimedia data for improving language proficiency

Research Project

Project/Area Number 18K11557
Research InstitutionKyoto Sangyo University

Principal Investigator

宮森 恒  京都産業大学, 情報理工学部, 教授 (90287988)

Project Period (FY) 2018-04-01 – 2023-03-31
Keywordsマルチモーダル / 読解力 / 統計データ / リランキング / ファクトチェック支援 / クエリ志向文書要約 / 深層学習 / 人工知能
Outline of Annual Research Achievements

最終年度の成果は以下の通りである。まず、テキストから視覚的要素を連想する能力について、画像・言語モデルがどの程度順序数の概念を的確に把握し活用できるのかについて調査し、参照表現中の必要な数え上げ数が増えると正解率が増加する等の傾向を確認した。図表と文脈を関係付ける能力について、文脈としての因果関係抽出の問題に取り組み、複数の言語モデルの単語埋め込みとマルチタスク学習を用いることで性能向上を実現できること、また、把握した内容を説明する能力について、外部知識を参照することでテキストから動画を生成する手法について基礎的な検討を行い、課題点を明らかにした。
補助事業期間全体を通じて実施した研究の成果は以下の通りである。まず、テキストから視覚的要素を連想する能力については、質問応答タスクにおいて、テキストのみで学習するモデルよりも、画像の特徴表現を融合的に利用した手法の方が、テストデータに対し高い正答率を出すことを確認した。次に、図表と文脈を関係付ける能力については、統計データ検索タスクにおいて、統計データのメタデータにはない情報を統計表本体から抽出し補強する手法が、従来手法を含め、最も良好な値を示すことを確認した。最後に、把握した内容を説明する能力については、テキスト、手話、動画の各々で説明するタスクについて、Transformerを活用することで、比較的長い系列を扱う場合でも優れた性能を発揮しうることを確認した。
本研究により、従来の自然言語処理だけでは得られない、より人間に近い的確な読解力を実現する基盤技術に貢献する成果を挙げることができた。AIの言語運用能力の向上は、超スマート社会の根幹を担う技術の一つであり、その意義は大きい。

  • Research Products

    (7 results)

All 2023 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (5 results) Remarks (1 results)

  • [Journal Article] プログレッシブトランスフォーマーを用いた日本手話SLPモデルの性能評価2023

    • Author(s)
      奥井 優太, 宮森 恒
    • Journal Title

      日本データベース学会データドリブンスタディーズ

      Volume: 1 Pages: 1-8

    • Peer Reviewed / Open Access
  • [Presentation] Transformerモデルに関する順序数の的確な把握と活用能力の調査2023

    • Author(s)
      小川 志龍, 林 寛治, 宮森 恒
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム DEIM2023
  • [Presentation] 外部知識参照型拡散モデルによるテキストからのビデオ生成2023

    • Author(s)
      王 墻, 宮森 恒
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム DEIM2023
  • [Presentation] 語彙習得段階を考慮した英文法多肢選択問題の誤答選択肢自動生成2023

    • Author(s)
      戸崎 友輔, 宮森 恒
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム DEIM2023
  • [Presentation] 画像・言語モデルに関する順序数の的確な把握と活用能力の調査2023

    • Author(s)
      増田 琉斗, 宮森 恒
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム DEIM2023
  • [Presentation] スマートフォンを用いた軽量な道路損傷の自動検出2023

    • Author(s)
      今西 智也, 宮森 恒
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム DEIM2023
  • [Remarks] 京都産業大学 情報理工学部 宮森研究室(メディア知能研究室)

    • URL

      http://milab.kyoto-su.ac.jp/

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi