• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

マルチモーダル処理による心的状態推定に基づいた音声対話システム

研究課題

研究課題/領域番号 15J07337
研究機関京都大学
特別研究員 井上 昂治  京都大学, 情報学研究科, 特別研究員(DC1)
研究期間 (年度) 2015-04-24 – 2018-03-31
キーワード対話システム / 心的状態 / マルチモーダル
研究実績の概要

自然な会話における人間の多様なふるまいを分析するために、マルチモーダルなセンサを用いたデータ収録システムを構築した。複数のマイクロホン、マイクロホンアレイ、RGBカメラ、深度センサを同時制御可能にした。本システムを用いて、15セッションの対話データを予備収録した。現在、同データを用いて、多様なふるまいと心的状態との関係について分析を進めている。次年度は、本収録システムにより、約100セッションの対話データの収録を予定しており、上記の分析および心的状態推定モデルの学習に用いる予定である。
対話システムの各要素技術についても研究・開発を行った。対話のインタフェースとして、人型アンドロイドERICAを用い、言語情報と非言語情報を統合したマルチモーダルな対話システムを実現した。また、ユーザのふるまいの自然性を実現するためには、従来の対話システムで見られるようにマイクロホン(またはスマートホン)をユーザが手に持つのではない、ハンズフリーの状況が望ましい。そこでマイクロホンアレイをERICAの周囲に配置した状況を想定した遠隔発話の音声認識について取り組んだ。音響モデルのマルチコンディション学習やデノイジングオートエンコーダの導入により、雑音環境下の遠隔発話でも、音声対話に充分な認識精度を実現した。さらに、複数のユーザと対話を行うためには、誰がいつ話しているかを検出する技術(話者区間検出)が必要である。音響情報だけでなく視線情報も用いることで、雑音環境下での頑健性を実現した。次年度以降に構築予定である、ユーザの心的状態を推定する対話システムにおいて、上記の各要素技術は、そのふるまいの自然性や頑健性に大きく寄与すると考えられる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

大量の対話データを獲得するためのマルチモーダル収録システムが構築され、予備収録および心的状態推定モデルの検討が行われているため。また、最終的に構築される予定の対話システムの各要素技術の頑健性が本研究課題により向上しているため。さらに、学術雑誌や国際会議での発表も行われているため。

今後の研究の推進方策

マルチモーダル対話収録システムを用いて約100セッションの対話データを収録し、心的状態のアノテーションを実施する。また、心的状態推定モデルの検討および精度検証を行う。さらに、これまでに構築してきた対話システムに、心的状態推定システムを搭載し、その有効性を確認する。

研究成果

(14件)

すべて 2016 2015

すべて 雑誌論文 学会発表

  • [雑誌論文] 多人数会話における音響・視線情報を統合した話者区間検出2016

    • 著者名/発表者名
      井上昂治, 若林佑幸, 吉本廣雅, 河原達也
    • 雑誌名

      電子情報通信学会論文誌

      巻: J99-D ページ: 348-357

    • DOI
      10.14923/transinfj.2015JDP7024
    • 査読あり / 謝辞記載あり
  • [雑誌論文] 視聴覚情報の統合に基づく音源数推定と話者ダイアライゼーション2016

    • 著者名/発表者名
      若林佑幸, 井上昂治, 中山雅人, 西浦敬信, 山下洋一, 吉本廣雅, 河原達也
    • 雑誌名

      電子情報通信学会論文誌

      巻: J99-D ページ: 326-336

    • DOI
      10.14923/transinfj.2015PDP0006
    • 査読あり
  • [雑誌論文] Multi-modal sensing and analysis of poster conversations with smart posterboard2016

    • 著者名/発表者名
      Tatsuya Kawahara, Takuma Iwatate, Koji Inoue, Soichiro Hayashi, Hiromasa Yoshimoto, Katsuya Takanashi
    • 雑誌名

      APSIPA Transactions on Signal and Information Processing

      巻: 5 ページ: 1-12

    • DOI
      10.1017/ATSIP.2016.2
    • 査読あり / オープンアクセスとしている
  • [学会発表] 傾聴対話システムのための多様な聞き手応答の生成2016

    • 著者名/発表者名
      石田真也, 井上昂治, 中村静, 高梨克也, 河原達也
    • 学会等名
      情報処理学会 第78回全国大会
    • 発表場所
      慶應義塾大学(神奈川県・横浜市)
    • 年月日
      2016-03-12 – 2016-03-12
  • [学会発表] 初対面対話における場の和みのマルチモーダルな分析と検出2016

    • 著者名/発表者名
      稲熊寛文, 井上昂治, 中村静, 高梨克也, 河原達也
    • 学会等名
      情報処理学会 第78回全国大会
    • 発表場所
      慶應義塾大学(神奈川県・横浜市)
    • 年月日
      2016-03-12 – 2016-03-12
  • [学会発表] 自律型アンドロイドERICAのための遠隔音声認識2016

    • 著者名/発表者名
      井上昂治, 三村正人, 石井カルロス寿憲, 河原達也
    • 学会等名
      日本音響学会 2016年春季研究発表会
    • 発表場所
      桐蔭横浜大学(神奈川県・横浜市)
    • 年月日
      2016-03-09 – 2016-03-09
  • [学会発表] 自律型アンドロイドによる円滑な発話権制御のためのフィラーの生起位置と形態の分析2016

    • 著者名/発表者名
      中西亮輔, 井上昂治, 中村静, 高梨克也, 河原達也
    • 学会等名
      人工知能学会 言語・音声理解と対話処理研究会
    • 発表場所
      中尾集落センター( 長野県・下高井戸郡野沢温泉村)
    • 年月日
      2016-03-01 – 2016-03-01
  • [学会発表] 傾聴対話システムのための言語情報と韻律情報に基づく多様な形態の相槌の生成2016

    • 著者名/発表者名
      山口貴史, 井上昂治, 吉野幸一郎, 高梨克也, Nigel G. Ward, 河原達也
    • 学会等名
      人工知能学会 言語・音声理解と対話処理研究会
    • 発表場所
      中尾集落センター( 長野県・下高井戸郡野沢温泉村)
    • 年月日
      2016-03-01 – 2016-03-01
  • [学会発表] Analysis and prediction of morphological patterns of backchannels for attentive listening agents2016

    • 著者名/発表者名
      Takashi Yamaguchi, Koji Inoue, Koichiro Yoshino, Katsuya Takanashi, Nigel G. Ward, Tatsuya Kawahara
    • 学会等名
      2016 International Workshop on Spoken Dialogue Systems
    • 発表場所
      Lapland(Finland)
    • 年月日
      2016-01-14 – 2016-01-14
    • 国際共著/国際学会である
  • [学会発表] 自律型アンドロイドEricaのための音声対話システム2015

    • 著者名/発表者名
      井上昂治, 河原達也
    • 学会等名
      人工知能学会 言語・音声理解と対話処理研究会
    • 発表場所
      早稲田大学(東京都・新宿区)
    • 年月日
      2015-10-29 – 2015-10-29
  • [学会発表] 多様な相槌をうつ傾聴対話システムのための相槌形態の予測2015

    • 著者名/発表者名
      山口貴史, 井上昂治, 吉野幸一郎, 高梨克也, Nigel G. Ward, 河原達也
    • 学会等名
      人工知能学会 言語・音声理解と対話処理研究会
    • 発表場所
      早稲田大学(東京都・新宿区)
    • 年月日
      2015-10-29 – 2015-10-29
  • [学会発表] ポスター会話における音響・視線情報の確率的統合による 話者区間及び相槌の検出2015

    • 著者名/発表者名
      井上昂治, 若林佑幸, 吉本廣雅, 高梨克也, 河原達也
    • 学会等名
      日本音響学会 2015年秋季研究発表会
    • 発表場所
      会津大学(福島県・会津若松市)
    • 年月日
      2015-09-17 – 2015-09-17
  • [学会発表] Enhanced speaker diarization with detection of backchannels using eye-gaze information in poster conversations2015

    • 著者名/発表者名
      Koji Inoue, Yukoh Wakabayashi, Hiromasa Yoshimoto, Katsuya Takanashi, and Tatsuya Kawahara
    • 学会等名
      INTERSPEECH 2015
    • 発表場所
      Dresden(Germany)
    • 年月日
      2015-09-10 – 2015-09-10
    • 国際共著/国際学会である
  • [学会発表] スマートポスターボードにおける視線情報を用いた話者区間及び相槌の検出2015

    • 著者名/発表者名
      井上昂治, 若林佑幸, 吉本廣雅, 高梨克也, 河原達也
    • 学会等名
      情報処理学会 音楽情報科学研究会
    • 発表場所
      電気通信大学(東京都・調布市)
    • 年月日
      2015-05-24 – 2015-05-24

URL: 

公開日: 2016-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi