楽しい雑談対話の要因解明のためのリアルなＣＧとのマルチモーダル対話システム構築

公募研究

研究領域	人間機械共生社会を目指した対話知能システム学
研究課題/領域番号	20H05562
研究種目	新学術領域研究(研究領域提案型)
配分区分	補助金
審査区分	複合領域
研究機関	豊橋技術科学大学
研究代表者	北岡教英豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)
研究期間 (年度)	2020-04-01 – 2022-03-31
研究課題ステータス	完了 (2021年度)
配分額 *注記	11,700千円 (直接経費: 9,000千円、間接経費: 2,700千円) 2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円) 2020年度: 5,720千円 (直接経費: 4,400千円、間接経費: 1,320千円)
キーワード	フォトリアルCG / 音声対話 / マルチモーダル対話 / CGエージェント
研究開始時の研究の概要	人間-機械共生・協奏を目指し、リアルなアンドロイドやCG エージェントとの、より人間らしい楽しめる対話・雑談ができることが必要となってきた。そこで、フォトリアルな高校生CG エージェント「Saya」に着目し、まるで人間と話すかのように音声や表情・視線を用いたマルチモーダル対話ができるシステムを構築し、「音声・マルチモーダル対話が楽しめる要因は何か？」を明らかにする。そのために、雑談対話に必要な実時間で高精度な音声・表情・ジェスチャ認識、多様な入出力や文脈に合わせた韻律・ジェスチャ制御に基づく応答生成、を実現し、フォトリアリスティックなCG との対話システムを構築して対話実験を行う。
研究実績の概要	将来の人間－機械協奏社会を考えると，機械がいかに人間に近い存在になり自然で容易にコミュニケーションが取れるようになるかは重要な課題となる。人間に近い姿をすることは一つの可能性であり、我々は本物の人間と区別がつかない3D CG「Saya」に注目し，Sayaをエージェントとして音声・マルチモーダル対話を行えるシステムの構築を行った。みかけがリアルである分、音声対話の応答内容もリアルでないと不釣り合いになる。そうしたリアルな応答生成の手段として、ChatGPTが大きく取り上げられる中、履歴から次の発話を生成するのみのChatGPTのような生成モデルでは内容が制御しにくいという問題がある。それに対してどのような話題で応答を生成したいかを与えてその話題に近い発話をするようなデータセットを用意し、それによってファインチューニングすることで、応答生成時にも話題を与えることで話題を制御できる方法を考案した。また、こうして生成された応答を、相手が話しを終えて発話権が移ったうえで音声として発する必要がある。そのために、今の相手の発話の切れ目（無音）を発話終端とみなして話してよいかどうかを判定する発話終端検出手法を提案した。そして、提案しているROSベースのリアルタイム音声対話システム上に実装した。
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

報告書

(2件)

2021 実績報告書
2020 実績報告書

研究成果
(14件)

すべて 2023 2022 2021

すべて雑誌論文 (5件) (うち査読あり 3件、オープンアクセス 4件) 学会発表 (9件) (うち国際学会 3件)

[雑誌論文] 音声対話システムのための自由発話に対応した照応解析による入力発話への話題補完手法2022
- 著者名/発表者名
  Nishimura Ryota、Mori Raita、Ohta Kengo、Kitaoka Norihide
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 37 号: 3 ページ: IDS-F_1-13
- DOI
  10.1527/tjsai.37-3_IDS-F
- ISSN
  1346-0714, 1346-8030
- 年月日
  2022-05-01
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] フォトリアルCGエージェントとのマルチモーダル対話2022
- 著者名/発表者名
  北岡教英、西村良太、太田健吾
- 雑誌名
  
  日本音響学会誌
  
  巻: 78 号: 5 ページ: 257-264
- DOI
  10.20697/jasj.78.5_257
- ISSN
  0369-4232, 2432-2040
- 年月日
  2022-05-01
- 関連する報告書
  2021 実績報告書
- オープンアクセス
[雑誌論文] Response type selection for chat-like spoken dialog systems based on LSTM and multi-task learning2021
- 著者名/発表者名
  Ohta Kengo、Nishimura Ryota、Kitaoka Norihide
- 雑誌名
  
  Speech Communication
  
  巻: 133 ページ: 23-30
- DOI
  10.1016/j.specom.2021.07.003
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Dynamic out-of-vocabulary word registration to language model for speech recognition2021
- 著者名/発表者名
  Kitaoka Norihide、Chen Bohan、Obashi Yuya
- 雑誌名
  
  EURASIP Journal on Audio, Speech, and Music Processing
  
  巻: 2021 号: 1 ページ: 1-8
- DOI
  10.1186/s13636-020-00193-1
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 次世代の移動を支えるマルチモーダルエージェント“Saya”2021
- 著者名/発表者名
  大須賀晋, 田中五大, 鍋倉彩那, 藤井宏行, 中野涼太, 渡邊凌太, TELYUKA, 太田健吾, 西村良太, 北岡教英
- 雑誌名
  
  自動車技術
  
  巻: 75 ページ: 9-9
- 関連する報告書
  2020 実績報告書
[学会発表] 割り込み発話にも対応可能なリアルタイム話者交替システム2023
- 著者名/発表者名
  杉山雅和，西村良太，太田健吾，北岡教英
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] A response generation method of chat-bot system using input formatting and reference resolution2022
- 著者名/発表者名
  Takahiro Kinouchi, Norihide Kitaoka
- 学会等名
  ICAICTA-2022
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] EMOtive A.I. "Saya”2022
- 著者名/発表者名
  大須賀晋，田中五大，鍋倉彩那，中野涼太，渡邊凌太，石川友香，石川晃之，中村晃一，藤井裕也，堀内颯太，東中竜一郎，西村良太，太田健吾，北岡教英
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
- 関連する報告書
  2021 実績報告書
[学会発表] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022
- 著者名/発表者名
  森大輝，太田健吾，西村良太，小川厚徳, 北岡教英
- 学会等名
  日本音響学会
- 関連する報告書
  2020 実績報告書
[学会発表] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022
- 著者名/発表者名
  堀井こはる，福田芽衣子，太田健吾，西村良太，小川厚徳，北岡教英
- 学会等名
  日本音響学会
- 関連する報告書
  2020 実績報告書
[学会発表] Advanced language model fusion method for encoder-decoder model in Japanese speech2021
- 著者名/発表者名
  Daiki Mori, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
- 学会等名
  APSIPA ASC 2021
- 関連する報告書
  2020 実績報告書
- 国際学会
[学会発表] End-to-end spontaneous speech recognition using hesitation labeling2021
- 著者名/発表者名
  Koharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka
- 学会等名
  APSIPA ASC 2021
- 関連する報告書
  2020 実績報告書
- 国際学会
[学会発表] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021
- 著者名/発表者名
  森大輝，太田健吾，西村良太，小川厚徳，北岡教英
- 学会等名
  日本音響学会
- 関連する報告書
  2020 実績報告書
[学会発表] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021
- 著者名/発表者名
  堀井こはる，福田芽衣子，太田健吾，西村良太，北岡教英
- 学会等名
  日本音響学会
- 関連する報告書
  2020 実績報告書

楽しい雑談対話の要因解明のためのリアルなＣＧとのマルチモーダル対話システム構築

研究代表者

北岡 教英 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)

11,700千円 (直接経費: 9,000千円、間接経費: 2,700千円)

報告書

研究成果

[雑誌論文] 音声対話システムのための自由発話に対応した照応解析による入力発話への話題補完手法2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] フォトリアルCGエージェントとのマルチモーダル対話2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] Response type selection for chat-like spoken dialog systems based on LSTM and multi-task learning2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Dynamic out-of-vocabulary word registration to language model for speech recognition2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 次世代の移動を支えるマルチモーダルエージェント“Saya”2021

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 割り込み発話にも対応可能なリアルタイム話者交替システム2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] A response generation method of chat-bot system using input formatting and reference resolution2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] EMOtive A.I. "Saya”2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Advanced language model fusion method for encoder-decoder model in Japanese speech2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] End-to-end spontaneous speech recognition using hesitation labeling2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021

著者名/発表者名

学会等名

関連する報告書

北岡教英豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)