研究課題/領域番号 |
17300055
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 大学院・情報理工学系研究科, 教授 (50111472)
|
研究分担者 |
峯松 信明 東京大学, 大学院・新領域創成科学研究科, 准教授 (90273333)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
16,860千円 (直接経費: 15,300千円、間接経費: 1,560千円)
2007年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
2006年度: 5,100千円 (直接経費: 5,100千円)
2005年度: 5,000千円 (直接経費: 5,000千円)
|
キーワード | 生成過程モデル / 基本周波数パターン / コーパスベース手法 / 韻律制御 / 発話スタイル / HMM音声合成 / 焦点制御 / 音声対話システム / コーパスベース韻律制御 / 発話焦点 / 2段階処理 / 感情の程度 / 統計的手法 / 2段階手法 / 音声コーパス / 種々の調子 / 自動推定 / 感情 / アクセント属性 |
研究概要 |
基本周波数パターン生成過程のモデルを前提とし、コーパスベース手法により、任意の発話スタイルの音声を高品質に合成しうる音声合成手法を確立することを目的として研究を進めた結果、以下の成果をあげ、当初の計画を達成した。 1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定し、それによって基本周波数パターンを合成する手法を開発した。休止の位置と長さ、音素の長さを2分木により推定する手法と統合し、韻律制御手法を確立した。感情音声を始めとする種々のスタイルの音声合成を行って、手法の有効性を確認した。観測される基本周波数パターンについて、指令パラメータを2文木により自動的に抽出する手法を開発し、テキストの言語情報を入力とすることで、抽出精度が向上することを示した。 2.焦点を置いた発声の、特に置かない発声(基準発声)からのフレーズ指令、アクセント指令の差分を、アクセント型、文中の位置、及び基準発声の指令等を入力として推定する2分木を構築した。上記1に差分を適用することにより、焦点制御を良好に行い得ることを示した。 3.フレーズ成分をルールベース、声調成分をコーパスベースで生成する2段階処理の柔軟な基本周波数パターン生成手法を中国語音声について開発し、焦点制御等をルールベースで行い得ることを示した。 4.上記1,2で開発した手法とHMM音声合成を組み合わせた日本語・中国語音声合成システムを構築し、HMM音声合成の韻律制御よりも、自然性の高い合成音声が得られることを示した。また、種々の発話スタイルの合成音声が得られることを示した。 5.上記音声合成システムを用いた道案内音声対話システム、番組案内音声対話システムを構築し、ユーザの特徴や状況によって応答音声の発話スタイルを制御することを行い、開発した音声合成手法の有効性を実証した。
|