研究課題/領域番号 |
21300063
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 東京工業大学 |
研究代表者 |
小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
|
連携研究者 |
長橋 宏 東京工業大学, 像情報工学研究所, 教授 (20143084)
|
研究協力者 |
能勢 隆 東京工業大学, 大学院・総合理工学研究科, 助教 (90550591)
|
研究期間 (年度) |
2009 – 2011
|
研究課題ステータス |
完了 (2011年度)
|
配分額 *注記 |
9,750千円 (直接経費: 7,500千円、間接経費: 2,250千円)
2011年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2010年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2009年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
|
キーワード | 音声情報処理 / HMM音声合成 / テキスト音声合成 / 基本周波数量子化コンテキスト / 自然発話音声 / 重回帰HMM / 音声スタイル制御 / 音声スタイル推定 / モデル適応 / 対話音声合成 / スタイル推定 / 声質変換 / FO量子化 / 発話様式 |
研究概要 |
ユーザの嗜好や気分に応じた表現豊かな音声出力と,ユーザの個性,気分や話し方の変化に頑健な音声入力ができる音声インタラクションを実現するためのロバスト音声認識・合成技術の確立を目指して研究を行った。ロバスト音声合成では,基本周波数量子化に基づく韻律コンテキストや自然発話・会話音声合成のための拡張コンテキストに基づく音声合成手法を,またロバスト音声認識では,感情表現・発話様式などのパラ言語情報の検出・表出度合の推定手法及び高速なモデル適応手法を確立し,その有効性を示した。
|