• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

楽しい雑談対話の要因解明のためのリアルなCGとのマルチモーダル対話システム構築

公募研究

研究領域人間機械共生社会を目指した対話知能システム学
研究課題/領域番号 20H05562
研究機関豊橋技術科学大学

研究代表者

北岡 教英  豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)

研究期間 (年度) 2020-04-01 – 2022-03-31
キーワードフォトリアルCG / 音声対話 / マルチモーダル対話
研究実績の概要

将来の人間-機械協奏社会を考えたとき,機械側のインタフェースが限りなく人間に近い姿をさせることを考える。そこで我々は,本物の人間と区別がつかないレベルの3D CGで描かれリアルに動作する「Saya」をエージェントとして音声・マルチモーダル対話を行えるシステムを構築した。Sayaは実在感を得るため,皮膚や眼球,髪の毛に至るまでハンドメイドで作成した。またパフォーマンスキャプチャで,実在する人間の動作,表情を収録し,個性を付与する事で,独特のゆらぎと不確実性を表現する。様々な動作をレンダリングした映像をあらかじめ作成し,それらを接続している。音声合成には,ESPnet2において実装されているTacotron 2+ParallelWaveGANを用いている。OpenJTalkのイントネーション制御の一部を用いて高品質化している。赤外線カメラでは、画像に基づいて,顔向きや視線の検出,マスク・サングラスの有無の判定,発話有無の判定(Visual VAD),うなずきや首振りの検出を行っている。RGBカメラとしては4KのWebカメラを用いている。この画像からは,顔検出に基づいた顔画像処理,手検出に基づいたジェスチャ認識,さらに周囲の映像を用いた種々の認識を行っている。対話制御部は,MMDAgentにおいて開発されたものを改良して用いている。基本的には音声認識結果中の単語駆動によるオートマトン制御であるが,SQLと連携して記憶機能を実装したことにより,対話履歴における様々な話題を記憶しておくことが可能となった。また、雑談チャットボットシステムと相互に行き来することも可能になった。雑談チャットボットは、単純に雑談を行うだけではなく、雑談をしながらある特定の質問に話題を近づけていき、いずれその質問をすると言う、雑談に質問を織り交ぜるための質問誘導モデルを構築し、実際に対話システムに実装した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

フォトリアルCGエージェントSayaを用いたシステムが実際に動作し、様々な研究成果を盛り込んだ。対話制御にはシナリオ駆動のオートマトン制御にメモリ機能を追加したPush-downオートマトン制御を導入するとともに、一つの状態を雑談チャットボットによる対話に対応させることでシナリオ対話と雑談対話を行き来することを可能とした。音声合成では、韻律制御記号を入力に付与することで簡単に、大幅に音声の声質を向上した。エージェントの制御には、様々な認知科学的知見を取り入れて、対話の発話時やユーザ発話を聞いているときの体の動きや視線の動きまでを人間を模倣するようにし、非常に自然に対話を行えるようにした。これらの成果はアイシンからのプレスリリースやYouTubeでの発信が行われた。さらに、著名人との対談企画に参加し、著名人と対話している映像がWeb企画「「学校総選挙プロジェクト」においてその映像が公開された。

今後の研究の推進方策

雑談対話は、まだ話し手が合わせる必要が多くある。これをできる限りなくすような雑談チャットボットを開発する。その際にはSayaのパーソナリティなどを反映した「Sayaらしい」発話を目指す。音声認識および音声合成を高速化してよりリアルタイムで反応できるようにするとともに、並行して開発している、リアルタイムで応答も生成できる対話制御機構をSayaと結合する。こうして完成した対話システムは、ビルの案内役や高齢者施設における話し相手などの現場において実証実験する。収集した音声データを分析して対話制御の高精度化や音声認識の高度化などを図る。

  • 研究成果

    (9件)

すべて 2022 2021

すべて 雑誌論文 (3件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (6件) (うち国際学会 2件)

  • [雑誌論文] Response type selection for chat-like spoken dialog systems based on LSTM and multi-task learning2021

    • 著者名/発表者名
      Ohta Kengo、Nishimura Ryota、Kitaoka Norihide
    • 雑誌名

      Speech Communication

      巻: 133 ページ: 23~30

    • DOI

      10.1016/j.specom.2021.07.003

    • 査読あり / オープンアクセス
  • [雑誌論文] Dynamic out-of-vocabulary word registration to language model for speech recognition2021

    • 著者名/発表者名
      Kitaoka Norihide、Chen Bohan、Obashi Yuya
    • 雑誌名

      EURASIP Journal on Audio, Speech, and Music Processing

      巻: 2021 ページ: -

    • DOI

      10.1186/s13636-020-00193-1

    • 査読あり / オープンアクセス
  • [雑誌論文] 次世代の移動を支えるマルチモーダルエージェント“Saya”2021

    • 著者名/発表者名
      大須賀 晋, 田中 五大, 鍋倉 彩那, 藤井 宏行, 中野 涼太, 渡邊 凌太, TELYUKA, 太田 健吾, 西村 良太, 北岡 教英
    • 雑誌名

      自動車技術

      巻: 75 ページ: 9-9

  • [学会発表] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022

    • 著者名/発表者名
      森 大輝,太田 健吾,西村 良太,小川厚徳, 北岡 教英
    • 学会等名
      日本音響学会
  • [学会発表] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022

    • 著者名/発表者名
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,小川厚徳,北岡 教英
    • 学会等名
      日本音響学会
  • [学会発表] Advanced language model fusion method for encoder-decoder model in Japanese speech2021

    • 著者名/発表者名
      Daiki Mori, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
    • 学会等名
      APSIPA ASC 2021
    • 国際学会
  • [学会発表] End-to-end spontaneous speech recognition using hesitation labeling2021

    • 著者名/発表者名
      Koharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
    • 学会等名
      APSIPA ASC 2021
    • 国際学会
  • [学会発表] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

    • 著者名/発表者名
      森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英
    • 学会等名
      日本音響学会
  • [学会発表] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021

    • 著者名/発表者名
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
    • 学会等名
      日本音響学会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi