実世界における知識獲得のための対話システムの構築

Publicly Offered Research

Project Area	Studies on intelligent systems for dialogue toward the human-machine symbiotic society
Project/Area Number	20H05556
Research Category	Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
Allocation Type	Single-year Grants
Review Section	Complex systems
Research Institution	The University of Tokyo
Principal Investigator	原田達也東京大学, 先端科学技術研究センター, 教授 (60345113)
Project Period (FY)	2020-04-01 – 2022-03-31
Project Status	Completed (Fiscal Year 2021)
Budget Amount *help	¥18,720,000 (Direct Cost: ¥14,400,000、Indirect Cost: ¥4,320,000) Fiscal Year 2021: ¥9,360,000 (Direct Cost: ¥7,200,000、Indirect Cost: ¥2,160,000) Fiscal Year 2020: ¥9,360,000 (Direct Cost: ¥7,200,000、Indirect Cost: ¥2,160,000)
Keywords	画像認識 / 自然言語処理 / 対話 / 知識獲得
Outline of Research at the Start	本研究の目的は，人間とエージェントが対話を通じて実環境中に存在する未知物体の情報を獲得・学習し，対話継続可能とするシステムの構築である．近年の深層学習をはじめとした機械学習の進展は, 人間とエージェントが自然な対話を行うことを可能にしつつある．しかし，実環境において知識共有や獲得を目的とした対話の実現には，エージェント自身が知らない事実が何であるかを知ること，適切な質問の生成，人の回答を理解し，再学習に利用することが必要となるが，いずれも困難な問題であるため未だ実現に至っていない．本研究課題では，これらの本質的な問題解決に取り組んでいく．
Outline of Annual Research Achievements	本研究の目的は，人間とエージェントが対話を通じて実環境中に存在する未知物体の情報を獲得・学習し，対話継続可能とするシステムの構築である．近年の深層学習をはじめとした機械学習の進展は, 人間とエージェントが自然な対話を行うことを可能にしつつある．しかし，実環境において知識共有や獲得を目的とした対話の実現には，エージェント自身が実世界において知らない事象が何であるかを知ること，知らない事象に対する知識獲得のための適切な質問の生成すること，人間からの回答を理解し，再学習に利用することで知識として定着させることが必要となるが，いずれも困難な問題であるため未だ実現に至っていない．そこで本研究課題では，これらの本質的な問題解決に取り組んでいく．本年度は，視覚的質問応答（VQA）のためのサブ質問の生成課題に特に取り組んだ．従来のVQAモデルは，実世界の知識に関する推論を必要とする問題において，間違った推論を行う傾向がある．このような問題を解決するために本研究では，正しい推論に有用な補助的な知覚情報を積極的に獲得するための質問を生成する新しいVQAモデルを提案した．具体的には，本モデルは，１）質問に回答するためのVQAモデル，２）質問を生成するための視覚的質問生成（VQG）モデル，３）生成された質問が元の質問に答えるために有用な情報をどれだけ含んでいるかを推定する情報スコアモデルから構成される．VQGモデルは，情報スコアモデルから得られる情報量を最大化するように学習させることで，元の質問の回答に関する情報をできるだけ多く含むサブ質問を生成する．生成されたサブ質問とその回答を付加情報としてVQAモデルに入力することで，サブ質問を利用しないベースラインモデルよりも正確に元の質問に対する回答を予測できることが実験により示された．
Research Progress Status	令和3年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和3年度が最終年度であるため、記入しない。

Report

(2 results)

2021 Annual Research Report
2020 Annual Research Report

Research Products
(6 results)

All 2022 2021 2020

All Journal Article (6 results) (of which Int'l Joint Research: 1 results, Peer Reviewed: 6 results, Open Access: 6 results)

[Journal Article] ViNTER: Image Narrative Generation with Emotion-Arc-Aware Transformer2022
- Author(s)
  Kohei Uehara, Yusuke Mori, Yusuke Mukuta, Tatsuya Harada
- Journal Title
  
  The 1st International Workshop on Multimodal Understanding for the Web and Social Media (MUWS), co-located with The WebConf (WWW) 2022
  
  Volume: -
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Learning to Ask Informative Sub-Questions for Visual Question Answering2022
- Author(s)
  Kohei Uehara, Nan Duan, Tatsuya Harada
- Journal Title
  
  5th MUltimodal Learning and Applications Workshop (MULA 2022) in conjunction with CVPR 2022
  
  Volume: -
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Plug-and-Play Controller for Story Completion: A Pilot Study toward Emotion-aware Story Writing Assistance2022
- Author(s)
  Yusuke Mori, Hiroaki Yamane, Ryohei Shimizu, Tatsuya Harada
- Journal Title
  
  The First Workshop on Intelligent and Interactive Writing Assistants (In2Writing)
  
  Volume: -
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] The Nectar of Missing Position Prediction for Story Completion2021
- Author(s)
  Yusuke Mori, Hiroaki Yamane, Yusuke Mukuta, Tatsuya Harada
- Journal Title
  
  Workshop on Text2Story co-located with the 43rd European Conference on Information Retrieval (ECIR 2021)
  
  Volume: 2860 Pages: 65-69
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Interactive Video Retrieval with Dialog2020
- Author(s)
  Sho Maeoki, Kohei Uehara, Tatsuya Harada
- Journal Title
  
  Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops
  
  Volume: 1 Pages: 4091-4099
- DOI
  10.1109/cvprw50498.2020.00484
- Related Report
  2020 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Unsupervised Keyword Extraction for Full-sentence VQA2020
- Author(s)
  Kohei Uehara and Tatsuya Harada
- Journal Title
  
  Proceedings of the First International Workshop on Natural Language Processing Beyond Text
  
  Volume: - Pages: 51-59
- DOI
  10.18653/v1/2020.nlpbt-1.6
- Related Report
  2020 Annual Research Report
- Peer Reviewed / Open Access

実世界における知識獲得のための対話システムの構築

Principal Investigator

原田 達也 東京大学, 先端科学技術研究センター, 教授 (60345113)

¥18,720,000 (Direct Cost: ¥14,400,000、Indirect Cost: ¥4,320,000)

Report

Research Products

[Journal Article] ViNTER: Image Narrative Generation with Emotion-Arc-Aware Transformer2022

Author(s)

Journal Title

Related Report

[Journal Article] Learning to Ask Informative Sub-Questions for Visual Question Answering2022

Author(s)

Journal Title

Related Report

[Journal Article] Plug-and-Play Controller for Story Completion: A Pilot Study toward Emotion-aware Story Writing Assistance2022

Author(s)

Journal Title

Related Report

[Journal Article] The Nectar of Missing Position Prediction for Story Completion2021

Author(s)

Journal Title

Related Report

[Journal Article] Interactive Video Retrieval with Dialog2020

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Unsupervised Keyword Extraction for Full-sentence VQA2020

Author(s)

Journal Title

DOI

Related Report

原田達也東京大学, 先端科学技術研究センター, 教授 (60345113)