研究課題/領域番号 |
16700183
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 名城大学 (2005-2006) 和歌山大学 (2004) |
研究代表者 |
坂野 秀樹 名城大学, 理工学部, 講師 (20335003)
|
研究期間 (年度) |
2004 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
2006年度: 1,100千円 (直接経費: 1,100千円)
2005年度: 1,100千円 (直接経費: 1,100千円)
2004年度: 1,400千円 (直接経費: 1,400千円)
|
キーワード | 音声補間 / 音声モーフィング / 歌唱音声合成 / 感情音声合成 / 音声分析合成 / スペクトル / DPマッチング / ホルマント / 歌唱合成 / 感情マッピング / 基本周波数 / 距離尺度 |
研究概要 |
1.補間方法の評価・検証 音声補間の応用の一つである音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、本研究では、異なる話者間に比べて難易度の低い、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにしてきた。特に、同じ発声内容でもスペクトルや基本周波数の変化に富む感情音声並びに、テンポや音程が保たれているため話声よりも扱いの容易な歌唱音声の補間・モーフィングについて検討している。今年度は、より広範なデータを用いての補間方法の検討・評価を行った。 特徴点の設定方法を検討する中で、我々は声道断面積関数を利用したスペクトルの補間方法に関する手法を開発した。更なる高品質化のためには、より詳細な検討が必要であるが、極めて柔軟な補間が可能な手法となり得ることが確認されている。 2.音声補間を利用したシステムの構築 デモシステムの構築及び評価を行った。感情モーフィングを利用した中間的な感情を生成するシステム、入力歌唱音声のテンポを変更して合成するシステム、入力した音声のスペクトル及び基本周波数を実時間で変換して高品質な合成を行う実時間声質変換システムなどを構築した。特に、実時間声質変換システムについては、主観評価実験等による評価を行った結果を論文として投稿し、採録が決定している。このシステムに用いられている分析合成部分では、高品質音声分析合成方式であるSTRAIGHTをベースとしたものを用いているが、高速化や様々な工夫の導入により、実時間処理が難しいと言われていたSTRAIGHTの実時間処理を可能としている。この分析合成部分の評価を行った所、元のSTRAIGHTに比べれば劣化するものの、既存の分析合成であるケプストラムボコーダに比べて主観評価値のMOSにおいて1程度の品質向上が見られている。
|