研究実績の概要 |
本研究の目的は,人間とエージェントが対話を通じて実環境中に存在する未知物体の情報を獲得・学習し,対話継続可能とするシステムの構築である.近年の深層学習をはじめとした機械学習の進展は, 人間とエージェントが自然な対話を行うことを可能にしつつある.しかし,実環境において知識共有や獲得を目的とした対話の実現には,エージェント自身が実世界において知らない事象が何であるかを知ること,知らない事象に対する知識獲得のための適切な質問の生成すること,人間からの回答を理解し,再学習に利用することで知識として定着させることが必要となるが,いずれも困難な問題であるため未だ実現に至っていない.本研究課題では,これらの本質的な問題解決に取り組んでいく.本年度は,回答からの知識抽出の課題に取り組んだ.特に,視覚情報を用いた質問応答(Visual Question Answering, VQA)における回答からの知識抽出に焦点を当てて研究を実施した. 具体的には,既存のVQA手法の多くは,データセットを構築する際アノテータにできるだけ簡潔な回答となるような指示を行うために,回答は短くほとんどの場合単一の単語で構成されている.しかしながら,自然な状況における人とエージェント間での質問応答を考えた場合,人から得られる回答は単一単語ではなく文章である可能性が高い.このような自然なVQAと既存のVQA研究とのギャップを埋めるために,本年度はVQAのための回答から質問の該当箇所(キーワード)を抽出する新規のモデルとその教師なし学習手法を提案した.
|