2022 年度研究成果報告書

言語運用能力向上のためのAIのマルチメディアデータ読解力に関する研究

研究課題

PDF

研究課題/領域番号	18K11557
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分62020:ウェブ情報学およびサービス情報学関連
研究機関	京都産業大学
研究代表者	宮森恒京都産業大学, 情報理工学部, 教授 (90287988)
研究期間 (年度)	2018-04-01 – 2023-03-31
キーワード	マルチモーダル / 読解力 / 統計データ / リランキング / 質問応答 / 画像特徴量 / 深層学習 / 人工知能
研究成果の概要	本研究の目的は、画像や図表等のマルチメディアデータを活用したモデルを構築することにより、従来の自然言語処理だけでは得られない、より人間に近い的確な読解力を実現する基盤技術を確立することである。主な成果として、テキストと、テキストから得られる画像の特徴表現を融合的に利用した質問応答手法、ユーザが調べたいテキストから、表形式で記載された統計データを対象としてランキングし関連づける手法、文エンコーダによるクエリ指向要約を行い、把握した内容を説明する手法が挙げられる。
自由記述の分野	マルチメディアデータ工学
研究成果の学術的意義や社会的意義	本研究の学術的独自性は、文章を読みながら頭の中に視覚的要素を思い描いたり、文章を読む際に様々な知識や文脈と関係付けながらその内容理解を促進するといった、より人間らしい読解力を、画像や図表といったマルチメディアデータを活用したモデル構築により実現することに着眼している点である。本研究は、人とのより的確なインタラクションが求められるアプリケーションに広く応用することが可能であり、あらゆる場面で快適で豊かな生活を実現する超スマート社会の根幹を担う技術の一つとして貢献することが期待できる。