• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

マルチモーダル言語理解における敵対的データ拡張基盤の構築

研究課題

研究課題/領域番号 20H04269
研究機関慶應義塾大学

研究代表者

杉浦 孔明  慶應義塾大学, 理工学部(矢上), 准教授 (60470473)

研究期間 (年度) 2020-04-01 – 2023-03-31
キーワードクロスモーダル言語処理 / データ拡張 / 生活支援ロボット / マルチモーダル言語処理 / Sim2Real
研究実績の概要

本研究は、曖昧なユーザ指示に対するマルチモーダル言語理解・生成の基盤技術を確立するとともに、介助犬レベルのタスクを概ね実用レベルの精度で行う生活支援ロボットの構築を目的とする。本研究の到達目標は、(a) 敵対的データ拡張によるマルチモーダル言語理解、(b)マルチモーダル言語生成による学習データ大規模化、敵対的データ拡張の基盤技術確立、(c) Sim2Realアプローチによる転移学習と介助犬タスクでの評価、の3点である。研究グループを3班に分け、理解班・生成班・Sim2Real班として、本研究を遂行する。
本年度、生活支援ロボットによるマルチモーダル言語理解手法の高精度化を理解班は実施した。これまでに構築済みのMultimodal Target-Source Classifier (MTCM)を拡張し、Attention Branchを導入したマルチモーダル言語理解手法MTCM with Attention Branches (MTCM-AB)を構築した。標準データセットであるPFN-PICを用いて性能評価を行い、人間による予測精度と同等の精度を達成した。
生成班では、多様な状況に対して指示文を生成する手法を構築する。本年度は、Attention Branchをマルチモーダル言語生成に導入し、Attention Branch Encoder-Decoder Network (ABEN)を構築した。生活支援ロボットに関するマルチモーダルコーパスを構築するとともに、標準的な評価尺度を用いてベースライン手法との比較を行い、ABENの有効性を実証した。
Sim2Real班では、生活支援ロボットに関する大規模データ収集するシステムUnity Automatic Labeling Tool (UniALT)を構築した。当該システムを用いて、100万枚のラベル付き画像を収集した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度構築したMTCM with Attention Branches (MTCM-AB)は、標準データセット上でで人間による予測精度と同等の精度を達成している。この成果は、IEEE Robotics and Automation Letters (RAL)誌に採択された。また、構築したAttention Branch Encoder-Decoder Network (ABEN)に関する成果も、IEEE RAL誌に採択されている。Sim2Real班は、生活支援ロボットのタスク空間を高品質なVR空間で構築し、間取りや物体をランダムに変更して大規模なデータを収集するシステムUniALTを構築した。当該システムを用いて、100万枚のラベル付き画像を収集した。これは人間のラベラーが行う約800日分の作業に相当する。
これらの理由から、計画はおおむね順調に進展していると考えられる。

今後の研究の推進方策

次年度は、生活支援ロボットに関するマルチモーダル言語理解データセットを構築し、ベースライン手法との比較を行う。最終年度までに、生成班が構築するデータ生成手法を用いて指示文を生成させ、言語生成・理解のスパイラル的改善を目指す。
本年度構築したABENは「キッチンへ行って」のような移動表現を扱うことができない。よって、生成班では、移動通過点ごとのカメラ画像を入力とする拡張を行い、他の介助犬タスクに適用する。最終年度までに、実機およびシミュレーションにおいて有効性を評価する。
Sim2Real班では、生活支援ロボットの学習データを収集する。代表者は、Retrieveタスクの一部を行う手法PonNetを構築し良好な結果を得ており、PonNetを拡張して他の生活支援ロボットタスクに適用する。また、構築済みシミュレータの3Dモデルを増強し、高品質かつ多様なカスタマイズを施した環境を準備する。次に、実機への展開を行う。転移学習の枠組みを用いて、シミュレーションデータでの学習済みモデルを実機データに適用するとともに、実機データの拡張を行う。ロボットプラットフォームとして、生活支援ロボットHSRを用いる。最終年度までに、介助犬タスクの8割以上をカバーする。

  • 研究成果

    (6件)

すべて 2021 2020 その他

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件) 備考 (2件)

  • [雑誌論文] Predicting and attending to damaging collisions for placing everyday objects in photo-realistic simulations2021

    • 著者名/発表者名
      Magassouba Aly、Sugiura Komei、Nakayama Angelica、Hirakawa Tsubasa、Yamashita Takayoshi、Fujiyoshi Hironobu、Kawai Hisashi
    • 雑誌名

      Advanced Robotics

      巻: - ページ: 1~13

    • DOI

      10.1080/01691864.2021.1913446

    • 査読あり
  • [雑誌論文] Alleviating the Burden of Labeling: Sentence Generation by Attention Branch Encoder?Decoder Network2020

    • 著者名/発表者名
      Ogura Tadashi、Magassouba Aly、Sugiura Komei、Hirakawa Tsubasa、Yamashita Takayoshi、Fujiyoshi Hironobu、Kawai Hisashi
    • 雑誌名

      IEEE Robotics and Automation Letters

      巻: 5 ページ: 5945~5952

    • DOI

      10.1109/LRA.2020.3010735

    • 査読あり
  • [雑誌論文] A Multimodal Target-Source Classifier With Attention Branches to Understand Ambiguous Instructions for Fetching Daily Objects2020

    • 著者名/発表者名
      Magassouba Aly、Sugiura Komei、Kawai Hisashi
    • 雑誌名

      IEEE Robotics and Automation Letters

      巻: 5 ページ: 532~539

    • DOI

      10.1109/LRA.2019.2963649

    • 査読あり
  • [学会発表] Multimodal Attention Branch Networkに基づく把持命令文の生成2020

    • 著者名/発表者名
      小椋忠志, Magassouba Aly, 杉浦孔明, 平川翼, 山下隆義, 藤吉弘亘, 河井恒
    • 学会等名
      2020年度 人工知能学会全国大会
  • [備考] Semantic Machine Intelligence Laboratory

    • URL

      https://smilab.org

  • [備考] Komei Sugiura

    • URL

      https://komeisugiura.jp

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi