部分記号接地に基づくマルチモーダル対話基盤創成

公募研究

研究領域	人間機械共生社会を目指した対話知能システム学
研究課題/領域番号	20H05565
研究種目	新学術領域研究(研究領域提案型)
配分区分	補助金
審査区分	複合領域
研究機関	大阪大学
研究代表者	長井隆行大阪大学, 基礎工学研究科, 教授 (40303010)
研究期間 (年度)	2020-04-01 – 2022-03-31
研究課題ステータス	完了 (2021年度)
配分額 *注記	23,530千円 (直接経費: 18,100千円、間接経費: 5,430千円) 2021年度: 11,830千円 (直接経費: 9,100千円、間接経費: 2,730千円) 2020年度: 11,700千円 (直接経費: 9,000千円、間接経費: 2,700千円)
キーワード	部分記号接地 / 対話ロボット / マルチモーダル / マルチモーダル対話 / 記号接地 / 統合認知モデル / 感情 / 内受容
研究開始時の研究の概要	現状の対話システムは，陽に意味を扱っていない．一方，人間側は意味理解に基づいて対話を行う．このギャップは，対話の継続や再度対話する意思を阻害する．これに対して，ロボットが自身の身体を利用して，環境や人と相互作用することで言語を獲得するアルゴリズムの開発も進んでいる．しかし，このアプローチの問題は，経験するための機会や時間が膨大になることである．そこで本研究では，記号接地と記号非接地を融合させた意味理解モデル（部分記号接地モデル）に基づいた，マルチモーダル対話基盤の構築することを目指す．この基盤技術により，すべてを経験せずに言葉の意味を理解し，人と対話できるロボットの実現を目指す．
研究実績の概要	記号接地問題を，マルチモーダル情報におけるモダリティ間の関係性の学習と捉えると，部分記号接地問題はモダリティごとに事前学習したモデルを上位のモデルで統合し，全体を少量の全モダリティ共起データで学習することで，それらの関係を学習する問題と考えることができる．そこで，事前学習済みモデルをそれぞれのモダリティのエンコーダとして利用し，それらの出力をTransformerエンコーダで統合する手法を提案した．具体的には二つのモデルを提案した．一つ目はMultimodal Transformer Encoderの出力から入力を分類するモデルである．二つ目はマルチモーダル情報を入力としてあるモダリティの情報を生成するモデルである．提案手法ではそれぞれのモダリティについて事前学習したエンコーダを用いることで，マルチモーダル情報としては未知の表現であっても，それらのエンコーダによって既知の表現に近い情報が与えられると考える．またそれらの出力を統合したものをTransformerエンコーダへの入力とし，Self-Attention機構によって入力全体を俯瞰してモダリティ間の関係性を双方向に学習する．この方法ではモダリティの変更や追加時には事前学習済みエンコーダ部分を変更または追加し，その出力を続けて統合すれば良い．実験ではCMU-MOSIとMM-IMDbの二つのベンチマークデータセットを用いてマルチモーダル情報を分類した．提案手法はどちらのデータセットに対しても，State-of-the-Artを達成した．また提案手法では、本来の訓練用データセットの25%から50%程度の量でも既存研究と同等のパフォーマンスが得られることが分かった．マルチモーダル情報の生成実験では提案モデルを用いて言語情報と音声情報から表情情報を生成した．提案モデルでは発話のタイミングと内容に沿った生成結果が得られた．
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

報告書

(2件)

2021 実績報告書
2020 実績報告書

研究成果
(7件)

すべて 2022 2021 2020

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (5件) (うち国際学会 1件、招待講演 3件)

[雑誌論文] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models2022
- 著者名/発表者名
  Miyazawa Kazuki、Kyuragi Yuta、Nagai Takayuki
- 雑誌名
  
  IEEE Access
  
  巻: 10 ページ: 29821-29833
- DOI
  10.1109/access.2022.3159346
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Survey and perspective on social emotions in robotics2022
- 著者名/発表者名
  Hieida Chie、Nagai Takayuki
- 雑誌名
  
  Advanced Robotics
  
  巻: 36 号: 1-2 ページ: 17-32
- DOI
  10.1080/01691864.2021.2012512
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[学会発表] 自律ロボットの説明性と対話システム2021
- 著者名/発表者名
  長井隆行
- 学会等名
  第12回対話システムシンポジウム
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] インタラクションのフィールドと計算モデルをつなぐ2021
- 著者名/発表者名
  長井隆行
- 学会等名
  日本認知科学会第38回大会
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] From Intelligence to Creativity2021
- 著者名/発表者名
  Takayuki Nagai
- 学会等名
  ICDL2021
- 関連する報告書
  2021 実績報告書
- 国際学会 / 招待講演
[学会発表] Cross-modal BERT : Self-Attentionによるマルチモーダル情報表現の獲得と相互予測2020
- 著者名/発表者名
  久良木優太, 宮澤和貴, 青木達哉, 堀井隆斗, 長井隆行
- 学会等名
  人工知能学会全国大会
- 関連する報告書
  2020 実績報告書
[学会発表] Self-Attentionによる物体概念の形成2020
- 著者名/発表者名
  宮澤和貴, 青木達哉, 堀井隆斗, 長井隆行
- 学会等名
  第38回日本ロボット学会学術講演会
- 関連する報告書
  2020 実績報告書

部分記号接地に基づくマルチモーダル対話基盤創成

研究代表者

長井 隆行 大阪大学, 基礎工学研究科, 教授 (40303010)

23,530千円 (直接経費: 18,100千円、間接経費: 5,430千円)

報告書

研究成果

[雑誌論文] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Survey and perspective on social emotions in robotics2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] 自律ロボットの説明性と対話システム2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] インタラクションのフィールドと計算モデルをつなぐ2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] From Intelligence to Creativity2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Cross-modal BERT : Self-Attentionによるマルチモーダル情報表現の獲得と相互予測2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Self-Attentionによる物体概念の形成2020

著者名/発表者名

学会等名

関連する報告書

長井隆行大阪大学, 基礎工学研究科, 教授 (40303010)