2020 年度実績報告書

楽しい雑談対話の要因解明のためのリアルなＣＧとのマルチモーダル対話システム構築

公募研究

研究領域	人間機械共生社会を目指した対話知能システム学
研究課題/領域番号	20H05562
研究機関	豊橋技術科学大学
研究代表者	北岡教英豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)
研究期間 (年度)	2020-04-01 – 2022-03-31
キーワード	フォトリアルCG / 音声対話 / マルチモーダル対話
研究実績の概要	将来の人間－機械協奏社会を考えたとき，機械側のインタフェースが限りなく人間に近い姿をさせることを考える。そこで我々は，本物の人間と区別がつかないレベルの3D CGで描かれリアルに動作する「Saya」をエージェントとして音声・マルチモーダル対話を行えるシステムを構築した。Sayaは実在感を得るため，皮膚や眼球，髪の毛に至るまでハンドメイドで作成した。またパフォーマンスキャプチャで，実在する人間の動作，表情を収録し，個性を付与する事で，独特のゆらぎと不確実性を表現する。様々な動作をレンダリングした映像をあらかじめ作成し，それらを接続している。音声合成には，ESPnet2において実装されているTacotron 2+ParallelWaveGANを用いている。OpenJTalkのイントネーション制御の一部を用いて高品質化している。赤外線カメラでは、画像に基づいて，顔向きや視線の検出，マスク・サングラスの有無の判定，発話有無の判定（Visual VAD），うなずきや首振りの検出を行っている。RGBカメラとしては4KのWebカメラを用いている。この画像からは，顔検出に基づいた顔画像処理，手検出に基づいたジェスチャ認識，さらに周囲の映像を用いた種々の認識を行っている。対話制御部は，MMDAgentにおいて開発されたものを改良して用いている。基本的には音声認識結果中の単語駆動によるオートマトン制御であるが，SQLと連携して記憶機能を実装したことにより，対話履歴における様々な話題を記憶しておくことが可能となった。また、雑談チャットボットシステムと相互に行き来することも可能になった。雑談チャットボットは、単純に雑談を行うだけではなく、雑談をしながらある特定の質問に話題を近づけていき、いずれその質問をすると言う、雑談に質問を織り交ぜるための質問誘導モデルを構築し、実際に対話システムに実装した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由フォトリアルCGエージェントSayaを用いたシステムが実際に動作し、様々な研究成果を盛り込んだ。対話制御にはシナリオ駆動のオートマトン制御にメモリ機能を追加したPush-downオートマトン制御を導入するとともに、一つの状態を雑談チャットボットによる対話に対応させることでシナリオ対話と雑談対話を行き来することを可能とした。音声合成では、韻律制御記号を入力に付与することで簡単に、大幅に音声の声質を向上した。エージェントの制御には、様々な認知科学的知見を取り入れて、対話の発話時やユーザ発話を聞いているときの体の動きや視線の動きまでを人間を模倣するようにし、非常に自然に対話を行えるようにした。これらの成果はアイシンからのプレスリリースやYouTubeでの発信が行われた。さらに、著名人との対談企画に参加し、著名人と対話している映像がWeb企画「「学校総選挙プロジェクト」においてその映像が公開された。
今後の研究の推進方策	雑談対話は、まだ話し手が合わせる必要が多くある。これをできる限りなくすような雑談チャットボットを開発する。その際にはSayaのパーソナリティなどを反映した「Sayaらしい」発話を目指す。音声認識および音声合成を高速化してよりリアルタイムで反応できるようにするとともに、並行して開発している、リアルタイムで応答も生成できる対話制御機構をSayaと結合する。こうして完成した対話システムは、ビルの案内役や高齢者施設における話し相手などの現場において実証実験する。収集した音声データを分析して対話制御の高精度化や音声認識の高度化などを図る。

研究成果
(9件)

すべて 2022 2021

すべて雑誌論文 (3件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (6件) (うち国際学会 2件)

[雑誌論文] Response type selection for chat-like spoken dialog systems based on LSTM and multi-task learning2021
- 著者名/発表者名
  Ohta Kengo、Nishimura Ryota、Kitaoka Norihide
- 雑誌名
  
  Speech Communication
  
  巻: 133 ページ: 23～30
- DOI
  10.1016/j.specom.2021.07.003
- 査読あり / オープンアクセス
[雑誌論文] Dynamic out-of-vocabulary word registration to language model for speech recognition2021
- 著者名/発表者名
  Kitaoka Norihide、Chen Bohan、Obashi Yuya
- 雑誌名
  
  EURASIP Journal on Audio, Speech, and Music Processing
  
  巻: 2021 ページ: -
- DOI
  10.1186/s13636-020-00193-1
- 査読あり / オープンアクセス
[雑誌論文] 次世代の移動を支えるマルチモーダルエージェント“Saya”2021
- 著者名/発表者名
  大須賀晋, 田中五大, 鍋倉彩那, 藤井宏行, 中野涼太, 渡邊凌太, TELYUKA, 太田健吾, 西村良太, 北岡教英
- 雑誌名
  
  自動車技術
  
  巻: 75 ページ: 9-9
[学会発表] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022
- 著者名/発表者名
  森大輝，太田健吾，西村良太，小川厚徳, 北岡教英
- 学会等名
  日本音響学会
[学会発表] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022
- 著者名/発表者名
  堀井こはる，福田芽衣子，太田健吾，西村良太，小川厚徳，北岡教英
- 学会等名
  日本音響学会
[学会発表] Advanced language model fusion method for encoder-decoder model in Japanese speech2021
- 著者名/発表者名
  Daiki Mori, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
- 学会等名
  APSIPA ASC 2021
- 国際学会
[学会発表] End-to-end spontaneous speech recognition using hesitation labeling2021
- 著者名/発表者名
  Koharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
- 学会等名
  APSIPA ASC 2021
- 国際学会
[学会発表] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021
- 著者名/発表者名
  森大輝，太田健吾，西村良太，小川厚徳，北岡教英
- 学会等名
  日本音響学会
[学会発表] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021
- 著者名/発表者名
  堀井こはる，福田芽衣子，太田健吾，西村良太，北岡教英
- 学会等名
  日本音響学会

2020 年度 実績報告書

楽しい雑談対話の要因解明のためのリアルなＣＧとのマルチモーダル対話システム構築

研究代表者

北岡 教英 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Response type selection for chat-like spoken dialog systems based on LSTM and multi-task learning2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Dynamic out-of-vocabulary word registration to language model for speech recognition2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] 次世代の移動を支えるマルチモーダルエージェント“Saya”2021

著者名/発表者名

雑誌名

[学会発表] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022

著者名/発表者名

学会等名

[学会発表] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022

著者名/発表者名

学会等名

[学会発表] Advanced language model fusion method for encoder-decoder model in Japanese speech2021

著者名/発表者名

学会等名

[学会発表] End-to-end spontaneous speech recognition using hesitation labeling2021

著者名/発表者名

学会等名

[学会発表] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

著者名/発表者名

学会等名

[学会発表] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021

著者名/発表者名

学会等名

2020 年度実績報告書

北岡教英豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)