研究課題/領域番号 |
18K11557
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 京都産業大学 |
研究代表者 |
宮森 恒 京都産業大学, 情報理工学部, 教授 (90287988)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2018年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | マルチモーダル / 読解力 / 統計データ / リランキング / 質問応答 / 画像特徴量 / 深層学習 / 人工知能 / ファクトチェック支援 / クエリ志向文書要約 / マルチモーダル対話 / 内部状態推定 / 再ランキング / 手話生成 / 日本手話 / 3D動作 / ビデオ質問応答 / 字幕 / 感情 / 統計データ検索 / 表理解 / ヘッダ抽出 / 対話システム / 連想エンコーダ / ゲート機構 / 人物らしさ / 自然言語処理 / キャプション生成 / 文エンコーダ / マルチメディアデータ |
研究成果の概要 |
本研究の目的は、画像や図表等のマルチメディアデータを活用したモデルを構築することにより、従来の自然言語処理だけでは得られない、より人間に近い的確な読解力を実現する基盤技術を確立することである。 主な成果として、テキストと、テキストから得られる画像の特徴表現を融合的に利用した質問応答手法、ユーザが調べたいテキストから、表形式で記載された統計データを対象としてランキングし関連づける手法、文エンコーダによるクエリ指向要約を行い、把握した内容を説明する手法が挙げられる。
|
研究成果の学術的意義や社会的意義 |
本研究の学術的独自性は、文章を読みながら頭の中に視覚的要素を思い描いたり、文章を読む際に様々な知識や文脈と関係付けながらその内容理解を促進するといった、より人間らしい読解力を、画像や図表といったマルチメディアデータを活用したモデル構築により実現することに着眼している点である。本研究は、人とのより的確なインタラクションが求められるアプリケーションに広く応用することが可能であり、あらゆる場面で快適で豊かな生活を実現する超スマート社会の根幹を担う技術の一つとして貢献することが期待できる。
|