• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

言語運用能力向上のためのAIのマルチメディアデータ読解力に関する研究

研究課題

研究課題/領域番号 18K11557
研究機関京都産業大学

研究代表者

宮森 恒  京都産業大学, 情報理工学部, 教授 (90287988)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード質問応答 / 画像特徴量 / 連想エンコーダ / ゲート機構 / 対話システム / 人物らしさ / 深層学習 / 自然言語処理
研究実績の概要

まず、テキストから視覚的要素を連想する能力については、従来法で必要だった3段階の学習ステップ(テキスト特徴と視覚的特徴の抽出、視覚的特徴の連想、連想を用いた応答生成)を、1ステップで学習する手法(手法1)、及び、これにテキスト特徴と視覚的特徴を各々どのような重要度で利用するかを適応的に変化させるゲート機構を追加した手法(手法2)について検討した。手法1では、色を尋ねる質問には適切に対処できる一方、上位カテゴリを尋ねる質問に誤りが目立ったが、手法2では、ゲート機構の導入により、色や生息地を除くほとんどのカテゴリでより誤答を防ぎ、多様な質問により適切に回答できるようになっていることを確認した。
次に、図表と文脈を関係付ける能力については、特定の図表画像とそれに関する質問に回答する質問応答タスクにおいて、図表画像を表形式に変換しSQLで問い合わせる手法について検討した。その結果、従来研究で回答できなかった質問にも適切に回答できている事例が一部にはあるものの、図表の構成要素の画像認識、及び、SQLへの変換において誤りが大きく、十分な正答率を達成するには改善すべき点が多いことを確認した。
最後に、把握した内容を説明する能力については、質問応答や対話システムにおいて、開発者の意図した人物らしさを、話者情報(話者用例とその話者のプロフィール情報)を与えることで比較的容易に反映させることが可能な応答生成手法について検討した。評価実験では、複数の被験者がそれぞれ思い描いた人物らしさが提案手法による出力応答へ反映されることを確認した。一方、特殊な語尾や口癖などについては必ずしも適切に反映できていない点があり、今後改善していく予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

まず、テキストから視覚的要素を連想する能力については、当初の計画通り、視覚的要素の連想が機能していること、及び、2種類の分散表現から生成された回答が、テキストのみによる生成された回答に比べ、正答率が基本的に改善される傾向にあることを確認しているため。
次に、図表と文脈を関係付ける能力については、当初の計画通り、図表の構成要素を認識することで図表データの傾向を表現するモデルについて構築を進めているため。
最後に、把握した内容を説明する能力については、当初の計画に加え、質問応答や対話システムにおいて、開発者の意図した多様な人物らしさを、比較的容易に反映させる手法について検討し、基本性能を確認しているため。

今後の研究の推進方策

まず、テキストから視覚的要素を連想する能力については、より汎用的な質問に対する正答率を改善するため、テキスト特徴と視覚的特徴をより的確に獲得可能な学習手法など、性能向上に必要な改良を図る。
次に、図表と文脈を関係付ける能力については、現在のモデルを改良するか新たなモデルを構築することで、より的確に図表の傾向をテキストで生成できることを目指す。
最後に、把握した内容を説明する能力については、開発者の意図した多様な人物らしさを、比較的容易に反映させる手法で生成される応答を、特殊な語尾や口癖などについても適切に反映できるように改良を図る。

次年度使用額が生じた理由

新型コロナウィルス感染拡大のため、参加予定だった学会の現地開催が中止となり、当初予定していた出張旅費が未使用となり、残額が発生したため。研究成果発表等に伴う旅費や計算機関連機器の更新に必要な物品購入に充てる予定である。

  • 研究成果

    (6件)

すべて 2019 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (2件) (うち国際学会 2件) 備考 (2件)

  • [雑誌論文] 文エンコーダによるクエリ指向要約モデルの強化2019

    • 著者名/発表者名
      木村 輔、田上 諒、宮森 恒
    • 雑誌名

      情報処学会論文誌データベース(TOD)

      巻: 12 ページ: 66-79

    • 査読あり / オープンアクセス
  • [雑誌論文] 幸福感を提供するVR画像閲覧システムGaZone2019

    • 著者名/発表者名
      杉本 翔、岡部 稜、喜田 将生、宮森 恒
    • 雑誌名

      情報処理学会論文誌

      巻: 60 ページ: 1970-1977

    • 査読あり / オープンアクセス
  • [学会発表] KSU Systems at the NTCIR-14 QA Lab--PoliInfo Task2019

    • 著者名/発表者名
      木村 輔、田上 諒、勝山光、杉本 翔、宮森 恒
    • 学会等名
      The 14th NTCIR Conference
    • 国際学会
  • [学会発表] GaZone: VR Image Browsing System Providing Feelings of Happiness2019

    • 著者名/発表者名
      杉本 翔、宮森 恒
    • 学会等名
      Entertainment Computing and Serious Games. ICEC-JCSG 2019. LNCS11863
    • 国際学会
  • [備考] 文エンコーダによるクエリ指向要約モデルの強化

    • URL

      http://id.nii.ac.jp/1001/00199671/

  • [備考] 幸福感を提供するVR画像閲覧システムGaZone

    • URL

      http://id.nii.ac.jp/1001/00200578/

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi