研究課題/領域番号 |
12480079
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)
|
研究分担者 |
峯松 信明 東京大学, 大学院・情報理工学系研究科, 助教授 (90273333)
|
研究期間 (年度) |
2000 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
10,000千円 (直接経費: 10,000千円)
2002年度: 2,800千円 (直接経費: 2,800千円)
2001年度: 4,400千円 (直接経費: 4,400千円)
2000年度: 2,800千円 (直接経費: 2,800千円)
|
キーワード | 統計的音声合成 / ターミナルアナログ合成 / 波形接続合成 / HMM音声合成 / AR-HMMモデル / 基本周波数パターン / 生成過程モデル / 感情音声合成 / 波形編集合成 / 声帯音源波形モデル / フォルマント推定 / 統計的音声合成手法 / 分節的特徴 / 韻律的特徴 / 対話音声 / ARX分析 / モーラ持続時間 |
研究概要 |
統計的音声合成手法において、分節的特徴としては声道伝達関数の極・零周波数の高精度分析結果を、韻律的特徴についてはモデルによる制約を利用することによって、高品質音声合成を実現することを目的として研究を進めた結果、以下の成果をあげ、当初の計画を達成した。 1.高精度で極、零点の情報を抽出する逐次近似ARX分析手法を開発し、既開発のターミナルアナログ合成器と組み合わせた分析合成ワークベンチを構築した。これにより流音等の高品質化を達成した。 2.ターミナルアナログ・波形接続折衷型の音声合成器を開発し、高品質音声合成を実現した。 3.音源波形をHMMで表現するAR-HMMモデルを用いて安定したフォルマント抽出が可能な手法を開発した。合成実験を行って、基本周波数(FO)の変更等に対して音質の劣化が小さいことを示した。 4.波形接続合成において、接続部に対応する自然音声をスペクトル上で重みをかけて重ね合わせることで連続的なスペクトルが得られることを確認した。また、使用頻度による重みつきVQで合成に用いる音声コーパスを有効に削減する手法を開発した。 5.HMM音声合成を構築し、話者適応に必要なデータサイズを合成音声品質の観点から調べた。10文強で十分な性能に達することが示された。 6.統計的手法を用いて生成過程モデルのパラメータを推定し、FOパターンを生成した。語の係り受け情報等を用い、少数の音声データから高品質を達成した。同様の枠組みでテキストからアクセント句境界を推定する手法も開発した。さらに感情音声のFOパターン生成、音素時間長推定を行い、良好な結果を得た。 7.上記と関連し、FOパターン生成過程モデルの指令を自動的に推定する手法を開発し、韻律コーパスを作成した。 8.対話調音声合成のためのモーラ持続時間制御規則を作成し、音声合成実験により、その有効性を示した。
|