インタラクティブバーチャルアクター実現のための概念表現からの動作・音声生成

研究課題

研究課題/領域番号	17650046
研究種目	萌芽研究
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	東京工業大学
研究代表者	小林隆夫東京工業大学, 大学院総合理工学研究科, 教授 (70153616)
研究期間 (年度)	2005 – 2006
研究課題ステータス	完了 (2006年度)
配分額 *注記	3,200千円 (直接経費: 3,200千円) 2006年度: 1,700千円 (直接経費: 1,700千円) 2005年度: 1,500千円 (直接経費: 1,500千円)
キーワード	動作生成 / ソフトウェアロボット / 不明確性 / 木構造クラスタリング / 音声合成 / 平均声モデル / モデル適応 / 重回帰隠れセミマルコフモデル / 動作プリミティブ / 隠れマルコフモデル(HMM) / 隠れセミマルコフモデル(HSMM) / 重回帰HSMM / モーションキャプチャ
研究概要	本研究は,与えられたシナリオに沿ってソフトウェアロポットが動作と音声発話を同時に自動生成し,それを提示されたユーザの指示に従って,自ら動作と音声発話の修正を行うという「インタラクティブバーチャルアクター」の枠組みの提案及びその理論的基礎を確立することを目的とし,研究の第二年度として,初年度に収集したデータと構築した理論に基づいた動作のモデル化を行い,これと同時に,気の利いた音声応答のための多様な音声合成の検討を進め,音声インタラクションを実現するプロトタイプシステムの構築を行った。まず,動作生成の実現に関して,机の上の物体を移動させる動作に着目し,任意の始点・終点位置を指定して所望の動作を生成可能なソフトウェアロボットをコンピュータ上に構築するとともに,「少し」や「もうちょっと」といった不明確性を含む動作表現に関する概念モデルの自動構築法を提案した。提案モデルは,木構造クラスタリングを利用して,学習データが十分存在しない指示語一動作の組み合わせに対してもある程度対応が可能であるという頑健性を持っている。実際に,提案モデルに基づいて不明確性を含む音声指示入力が可能な工一ジェントを実現し,評価実験を行った結果,実現した工一ジェントは,人間が人間に対して言葉により指示を出す場合と同様な動作が可能であることを明らかにした。また,気の利いた音声応答の実現のために,多様な声質や発話様式・感情表現が可能な音声合成手法ならびに音声の発話様式・感情の検出手法について,平均声モデルに基づく音声合成手法,重回帰隠れセミマルコフモデルに基づいた音声のスタイル制御手法,話者性の変換のための新たなモデル適応手法をはじめとして,種々の検討を行った。

報告書

(2件)

2006 実績報告書
2005 実績報告書

研究成果
(8件)

すべて 2007 2006 2005

すべて雑誌論文 (8件)

[雑誌論文] 不明確性を含む動作表現のためのモデル構築法の検討2007
- 著者名/発表者名
  川島啓吾
- 雑誌名
  
  電子情報通信学会2007年総合大会講演論文集
  
  ページ: 188-188
- 関連する報告書
  2006 実績報告書
[雑誌論文] Average-voice-based speech synthesis using HSMM-based speaker adaptation and adaptive training2007
- 著者名/発表者名
  Junichi Yamagishi
- 雑誌名
  
  IEICE Trans. Information and Systems E90-D・2
  
  ページ: 533-543
- 関連する報告書
  2006 実績報告書
[雑誌論文] Constrained structural maximum a posteriori linear regression for average-voice-based speech synthesis2006
- 著者名/発表者名
  Yuji Nakano
- 雑誌名
  
  Proc. 9th International Conference on Spoken Language Processing, INTERSPEECH 2006 - ICSLP
  
  ページ: 2286-2289
- 関連する報告書
  2006 実績報告書
[雑誌論文] 合成音声のスタイル制御における話者適応の検討2006
- 著者名/発表者名
  井澤信介
- 雑誌名
  
  日本音響学会2006年秋季研究発表会講演論文集
  
  ページ: 255-256
- 関連する報告書
  2006 実績報告書
[雑誌論文] 重回帰HSMMを用いた音声のスタイル制御における多様性の検討2006
- 著者名/発表者名
  橘誠
- 雑誌名
  
  日本音響学会2006年秋季研究発表会講演論文集
  
  ページ: 257-258
- 関連する報告書
  2006 実績報告書
[雑誌論文] 線形変換とMAPに基づく音響モデル学習法の評価2006
- 著者名/発表者名
  大川高志
- 雑誌名
  
  日本音響学会2006年秋季研究発表会講演論文集
  
  ページ: 265-266
- 関連する報告書
  2006 実績報告書
[雑誌論文] Human walking motion synthesis with desired pace and stride length based on HSMM2005
- 著者名/発表者名
  Naotake Niwase
- 雑誌名
  
  IEICE Trans. Information and Systems E88-D・11
  
  ページ: 2492-2499
- 関連する報告書
  2005 実績報告書
[雑誌論文] Human walking motion synthesis based on multiple regression hidden semi-Markov mode I2005
- 著者名/発表者名
  Takashi Yamazaki
- 雑誌名
  
  Proc. Second International Workshop on Language Understanding and Agents for Real World Interaction, LUAR 2005
  
  ページ: 445-452
- 関連する報告書
  2005 実績報告書

インタラクティブバーチャルアクター実現のための概念表現からの動作・音声生成

研究代表者

小林 隆夫 東京工業大学, 大学院総合理工学研究科, 教授 (70153616)

3,200千円 (直接経費: 3,200千円)

報告書

研究成果

[雑誌論文] 不明確性を含む動作表現のためのモデル構築法の検討2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Average-voice-based speech synthesis using HSMM-based speaker adaptation and adaptive training2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Constrained structural maximum a posteriori linear regression for average-voice-based speech synthesis2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 合成音声のスタイル制御における話者適応の検討2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 重回帰HSMMを用いた音声のスタイル制御における多様性の検討2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 線形変換とMAPに基づく音響モデル学習法の評価2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Human walking motion synthesis with desired pace and stride length based on HSMM2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Human walking motion synthesis based on multiple regression hidden semi-Markov mode I2005

著者名/発表者名

雑誌名

関連する報告書

小林隆夫東京工業大学, 大学院総合理工学研究科, 教授 (70153616)