部分記号接地に基づくマルチモーダル対話基盤創成

Publicly Offered Research

Project Area	Studies on intelligent systems for dialogue toward the human-machine symbiotic society
Project/Area Number	20H05565
Research Category	Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
Allocation Type	Single-year Grants
Review Section	Complex systems
Research Institution	Osaka University
Principal Investigator	長井隆行大阪大学, 基礎工学研究科, 教授 (40303010)
Project Period (FY)	2020-04-01 – 2022-03-31
Project Status	Completed (Fiscal Year 2021)
Budget Amount *help	¥23,530,000 (Direct Cost: ¥18,100,000、Indirect Cost: ¥5,430,000) Fiscal Year 2021: ¥11,830,000 (Direct Cost: ¥9,100,000、Indirect Cost: ¥2,730,000) Fiscal Year 2020: ¥11,700,000 (Direct Cost: ¥9,000,000、Indirect Cost: ¥2,700,000)
Keywords	部分記号接地 / 対話ロボット / マルチモーダル / マルチモーダル対話 / 記号接地 / 統合認知モデル / 感情 / 内受容
Outline of Research at the Start	現状の対話システムは，陽に意味を扱っていない．一方，人間側は意味理解に基づいて対話を行う．このギャップは，対話の継続や再度対話する意思を阻害する．これに対して，ロボットが自身の身体を利用して，環境や人と相互作用することで言語を獲得するアルゴリズムの開発も進んでいる．しかし，このアプローチの問題は，経験するための機会や時間が膨大になることである．そこで本研究では，記号接地と記号非接地を融合させた意味理解モデル（部分記号接地モデル）に基づいた，マルチモーダル対話基盤の構築することを目指す．この基盤技術により，すべてを経験せずに言葉の意味を理解し，人と対話できるロボットの実現を目指す．
Outline of Annual Research Achievements	記号接地問題を，マルチモーダル情報におけるモダリティ間の関係性の学習と捉えると，部分記号接地問題はモダリティごとに事前学習したモデルを上位のモデルで統合し，全体を少量の全モダリティ共起データで学習することで，それらの関係を学習する問題と考えることができる．そこで，事前学習済みモデルをそれぞれのモダリティのエンコーダとして利用し，それらの出力をTransformerエンコーダで統合する手法を提案した．具体的には二つのモデルを提案した．一つ目はMultimodal Transformer Encoderの出力から入力を分類するモデルである．二つ目はマルチモーダル情報を入力としてあるモダリティの情報を生成するモデルである．提案手法ではそれぞれのモダリティについて事前学習したエンコーダを用いることで，マルチモーダル情報としては未知の表現であっても，それらのエンコーダによって既知の表現に近い情報が与えられると考える．またそれらの出力を統合したものをTransformerエンコーダへの入力とし，Self-Attention機構によって入力全体を俯瞰してモダリティ間の関係性を双方向に学習する．この方法ではモダリティの変更や追加時には事前学習済みエンコーダ部分を変更または追加し，その出力を続けて統合すれば良い．実験ではCMU-MOSIとMM-IMDbの二つのベンチマークデータセットを用いてマルチモーダル情報を分類した．提案手法はどちらのデータセットに対しても，State-of-the-Artを達成した．また提案手法では、本来の訓練用データセットの25%から50%程度の量でも既存研究と同等のパフォーマンスが得られることが分かった．マルチモーダル情報の生成実験では提案モデルを用いて言語情報と音声情報から表情情報を生成した．提案モデルでは発話のタイミングと内容に沿った生成結果が得られた．
Research Progress Status	令和3年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和3年度が最終年度であるため、記入しない。

Report

(2 results)

2021 Annual Research Report
2020 Annual Research Report

Research Products
(7 results)

All 2022 2021 2020

All Journal Article (2 results) (of which Peer Reviewed: 2 results, Open Access: 2 results) Presentation (5 results) (of which Int'l Joint Research: 1 results, Invited: 3 results)

[Journal Article] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models2022
- Author(s)
  Miyazawa Kazuki、Kyuragi Yuta、Nagai Takayuki
- Journal Title
  
  IEEE Access
  
  Volume: 10 Pages: 29821-29833
- DOI
  10.1109/access.2022.3159346
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Survey and perspective on social emotions in robotics2022
- Author(s)
  Hieida Chie、Nagai Takayuki
- Journal Title
  
  Advanced Robotics
  
  Volume: 36 Issue: 1-2 Pages: 17-32
- DOI
  10.1080/01691864.2021.2012512
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Presentation] 自律ロボットの説明性と対話システム2021
- Author(s)
  長井隆行
- Organizer
  第12回対話システムシンポジウム
- Related Report
  2021 Annual Research Report
- Invited
[Presentation] インタラクションのフィールドと計算モデルをつなぐ2021
- Author(s)
  長井隆行
- Organizer
  日本認知科学会第38回大会
- Related Report
  2021 Annual Research Report
- Invited
[Presentation] From Intelligence to Creativity2021
- Author(s)
  Takayuki Nagai
- Organizer
  ICDL2021
- Related Report
  2021 Annual Research Report
- Int'l Joint Research / Invited
[Presentation] Cross-modal BERT : Self-Attentionによるマルチモーダル情報表現の獲得と相互予測2020
- Author(s)
  久良木優太, 宮澤和貴, 青木達哉, 堀井隆斗, 長井隆行
- Organizer
  人工知能学会全国大会
- Related Report
  2020 Annual Research Report
[Presentation] Self-Attentionによる物体概念の形成2020
- Author(s)
  宮澤和貴, 青木達哉, 堀井隆斗, 長井隆行
- Organizer
  第38回日本ロボット学会学術講演会
- Related Report
  2020 Annual Research Report

部分記号接地に基づくマルチモーダル対話基盤創成

Principal Investigator

長井 隆行 大阪大学, 基礎工学研究科, 教授 (40303010)

¥23,530,000 (Direct Cost: ¥18,100,000、Indirect Cost: ¥5,430,000)

Report

Research Products

[Journal Article] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Survey and perspective on social emotions in robotics2022

Author(s)

Journal Title

DOI

Related Report

[Presentation] 自律ロボットの説明性と対話システム2021

Author(s)

Organizer

Related Report

[Presentation] インタラクションのフィールドと計算モデルをつなぐ2021

Author(s)

Organizer

Related Report

[Presentation] From Intelligence to Creativity2021

Author(s)

Organizer

Related Report

[Presentation] Cross-modal BERT : Self-Attentionによるマルチモーダル情報表現の獲得と相互予測2020

Author(s)

Organizer

Related Report

[Presentation] Self-Attentionによる物体概念の形成2020

Author(s)

Organizer

Related Report

長井隆行大阪大学, 基礎工学研究科, 教授 (40303010)