2020 Fiscal Year Annual Research Report
実世界における知識獲得のための対話システムの構築
Publicly Offered Research
Project Area | Studies on intelligent systems for dialogue toward the human-machine symbiotic society |
Project/Area Number |
20H05556
|
Research Institution | The University of Tokyo |
Principal Investigator |
原田 達也 東京大学, 先端科学技術研究センター, 教授 (60345113)
|
Project Period (FY) |
2020-04-01 – 2022-03-31
|
Keywords | 画像認識 / 自然言語処理 / 対話 |
Outline of Annual Research Achievements |
本研究の目的は,人間とエージェントが対話を通じて実環境中に存在する未知物体の情報を獲得・学習し,対話継続可能とするシステムの構築である.近年の深層学習をはじめとした機械学習の進展は, 人間とエージェントが自然な対話を行うことを可能にしつつある.しかし,実環境において知識共有や獲得を目的とした対話の実現には,エージェント自身が実世界において知らない事象が何であるかを知ること,知らない事象に対する知識獲得のための適切な質問の生成すること,人間からの回答を理解し,再学習に利用することで知識として定着させることが必要となるが,いずれも困難な問題であるため未だ実現に至っていない.本研究課題では,これらの本質的な問題解決に取り組んでいく.本年度は,回答からの知識抽出の課題に取り組んだ.特に,視覚情報を用いた質問応答(Visual Question Answering, VQA)における回答からの知識抽出に焦点を当てて研究を実施した. 具体的には,既存のVQA手法の多くは,データセットを構築する際アノテータにできるだけ簡潔な回答となるような指示を行うために,回答は短くほとんどの場合単一の単語で構成されている.しかしながら,自然な状況における人とエージェント間での質問応答を考えた場合,人から得られる回答は単一単語ではなく文章である可能性が高い.このような自然なVQAと既存のVQA研究とのギャップを埋めるために,本年度はVQAのための回答から質問の該当箇所(キーワード)を抽出する新規のモデルとその教師なし学習手法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ユーザから得られた回答は自然言語で記述された文章ために,文章のどの部分が欲しい情報(知識)であるか特定する必要がある.得られた知識を学習に利用することを考慮すると,知識はクラス名などの単語(キーワード)で得られたほうがよい.そこで,本年度の目標を,自然言語記述から質問の回答に対応するキーワードの抽出手法を開発と定めていた. この目標に対して,本年度は,VQAのための回答から質問のキーワードを抽出する新規のモデルとその教師なし学習手法を提案した.完全文の回答は,質問に対する新しいキーワードと,すでに質問に含まれている情報の二つに分解できるといった仮定に基づいて提案手法を構築している.さらに,提案手法では,この分解を確実に行うために,判別的なデコーダを設計した.完全文の回答を含むVQAデータセットを用いて実験を行い,提案手法はキーワードを明示的に教師情報として与えなくても,回答中のキーワードを正しく抽出できることを示した. 以上より,当初の計画通りに進んでおり,本プロジェクトはおおむね順調に進展していると判断した.
|
Strategy for Future Research Activity |
本年度は,エージェントが行った質問に対するユーザの回答からキーワードを抽出する手法を開発した.来年度は,質問とユーザから得られたキーワードを用いて知識を獲得し,次第にエージェントが賢くなる手法の構築を目指す.具体的には,人間が新しい知識を獲得するための行動を参考に,エージェントが質問をして新しい知識を動的に学習することで,常識を考慮した視覚的質問応答(VQA)を学習することが可能な新しいフレームワークを提案する.
|