2010 Fiscal Year Annual Research Report
個性及び表現性ロバストな音声言語インタフェースに関する研究
Project/Area Number |
21300063
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 隆夫 東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)
|
Keywords | HMM音声合成 / テキスト音声合成 / 基本周波数量子化コンテキスト / 対話音声合成 / 自然発話音声 / 重回帰HMM / スタイル推定 / モデル適応 |
Research Abstract |
本研究はロバスト音声合成とロバスト音声認識に関する5項目の基盤要素技術の研究・開発からなり,本年度(第二年度)は初年度に得られた検討結果と成果に基づいて研究を進展させ,以下の成果が得られた。 感情表現・発話様式・声質を制御可能な音声合成に関しては,提案した基本周波数量子化コンテキストを用いた音声合成手法の検討を行い,新たな韻律のモデル化と生成手法の基本的な枠組みを確立すると共に,声質変換ならびに音声符号化への応用の検討を行い,従来法に比べて性能が改善されることを示した。また多言語音声合成の一例としてタイ語について有効性を確認した。さらに日本語と英語音声合成のためのコンテキストについても検討を行った。 自然発話・会話音声の合成に関しては,HMM音声合成の枠組みに基づいた多様で自然な韻律を持った対話音声合成を実現するために,日本語話し言葉音声コーパス(CSJ)を利用した新たなコンテキストセットの提案と基礎的な評価を行い,その有用性を明らかにした。 パラ言語情報の検出・表出度合推定では,初年度に確立した重回帰HMMに基づく音声のスタイル表出度合推定法を,音声からの話者年齢推定手法へ応用し予備的な評価実験を行った結果,有意な相関が得られることを示した。また,実音声に現れる強調表現の自動検出への応用についても基礎的な検討を行った。 話者・スタイル変動に頑健な音声認識に関しては,初年度においてほぼ確立したスタイル推定に基づくオンライン適応手法のさらなる性能改善や他のタスクへの応用に向けた可能性の検討を行った。 動作からのパラ言語情報の抽出に関しては,初年度に引き続きスタイル推定に適した身体特徴量の検討と動作に関するスタイル推定の基礎的な検討を行った。
|
Research Products
(26 results)