2021 Fiscal Year Annual Research Report

部分記号接地に基づくマルチモーダル対話基盤創成

Publicly Offered Research

Project Area	Studies on intelligent systems for dialogue toward the human-machine symbiotic society
Project/Area Number	20H05565
Research Institution	Osaka University
Principal Investigator	長井隆行大阪大学, 基礎工学研究科, 教授 (40303010)
Project Period (FY)	2020-04-01 – 2022-03-31
Keywords	部分記号接地 / 対話ロボット / マルチモーダル
Outline of Annual Research Achievements	記号接地問題を，マルチモーダル情報におけるモダリティ間の関係性の学習と捉えると，部分記号接地問題はモダリティごとに事前学習したモデルを上位のモデルで統合し，全体を少量の全モダリティ共起データで学習することで，それらの関係を学習する問題と考えることができる．そこで，事前学習済みモデルをそれぞれのモダリティのエンコーダとして利用し，それらの出力をTransformerエンコーダで統合する手法を提案した．具体的には二つのモデルを提案した．一つ目はMultimodal Transformer Encoderの出力から入力を分類するモデルである．二つ目はマルチモーダル情報を入力としてあるモダリティの情報を生成するモデルである．提案手法ではそれぞれのモダリティについて事前学習したエンコーダを用いることで，マルチモーダル情報としては未知の表現であっても，それらのエンコーダによって既知の表現に近い情報が与えられると考える．またそれらの出力を統合したものをTransformerエンコーダへの入力とし，Self-Attention機構によって入力全体を俯瞰してモダリティ間の関係性を双方向に学習する．この方法ではモダリティの変更や追加時には事前学習済みエンコーダ部分を変更または追加し，その出力を続けて統合すれば良い．実験ではCMU-MOSIとMM-IMDbの二つのベンチマークデータセットを用いてマルチモーダル情報を分類した．提案手法はどちらのデータセットに対しても，State-of-the-Artを達成した．また提案手法では、本来の訓練用データセットの25%から50%程度の量でも既存研究と同等のパフォーマンスが得られることが分かった．マルチモーダル情報の生成実験では提案モデルを用いて言語情報と音声情報から表情情報を生成した．提案モデルでは発話のタイミングと内容に沿った生成結果が得られた．
Research Progress Status	令和3年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和3年度が最終年度であるため、記入しない。

Research Products
(5 results)

All 2022 2021

All Journal Article (2 results) (of which Peer Reviewed: 2 results, Open Access: 2 results) Presentation (3 results) (of which Int'l Joint Research: 1 results, Invited: 3 results)

[Journal Article] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models2022
- Author(s)
  Miyazawa Kazuki、Kyuragi Yuta、Nagai Takayuki
- Journal Title
  
  IEEE Access
  
  Volume: 10 Pages: 29821～29833
- DOI
  10.1109/ACCESS.2022.3159346
- Peer Reviewed / Open Access
[Journal Article] Survey and perspective on social emotions in robotics2022
- Author(s)
  Hieida Chie、Nagai Takayuki
- Journal Title
  
  Advanced Robotics
  
  Volume: 36 Pages: 17～32
- DOI
  10.1080/01691864.2021.2012512
- Peer Reviewed / Open Access
[Presentation] 自律ロボットの説明性と対話システム2021
- Author(s)
  長井隆行
- Organizer
  第12回対話システムシンポジウム
- Invited
[Presentation] インタラクションのフィールドと計算モデルをつなぐ2021
- Author(s)
  長井隆行
- Organizer
  日本認知科学会第38回大会
- Invited
[Presentation] From Intelligence to Creativity2021
- Author(s)
  Takayuki Nagai
- Organizer
  ICDL2021
- Int'l Joint Research / Invited

2021 Fiscal Year Annual Research Report

部分記号接地に基づくマルチモーダル対話基盤創成

Principal Investigator

長井 隆行 大阪大学, 基礎工学研究科, 教授 (40303010)

Research Products

[Journal Article] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models2022

Author(s)

Journal Title

DOI

[Journal Article] Survey and perspective on social emotions in robotics2022

Author(s)

Journal Title

DOI

[Presentation] 自律ロボットの説明性と対話システム2021

Author(s)

Organizer

[Presentation] インタラクションのフィールドと計算モデルをつなぐ2021

Author(s)

Organizer

[Presentation] From Intelligence to Creativity2021

Author(s)

Organizer

長井隆行大阪大学, 基礎工学研究科, 教授 (40303010)