2006 Fiscal Year Annual Research Report
聴覚特性を考慮した音声信号の高品質補間に関する研究
Project/Area Number |
16700183
|
Research Institution | Meijo University |
Principal Investigator |
坂野 秀樹 名城大学, 理工学部, 講師 (20335003)
|
Keywords | 音声補間 / 音声モーフィング / 歌唱音声合成 / 感情音声合成 / 音声分析合成 / スペクトル / DPマッチング / ホルマント |
Research Abstract |
1.補間方法の評価・検証 音声補間の応用の一つである音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、本研究では、異なる話者間に比べて難易度の低い、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにしてきた。特に、同じ発声内容でもスペクトルや基本周波数の変化に富む感情音声並びに、テンポや音程が保たれているため話声よりも扱いの容易な歌唱音声の補間・モーフィングについて検討している。今年度は、より広範なデータを用いての補間方法の検討・評価を行った。 特徴点の設定方法を検討する中で、我々は声道断面積関数を利用したスペクトルの補間方法に関する手法を開発した。更なる高品質化のためには、より詳細な検討が必要であるが、極めて柔軟な補間が可能な手法となり得ることが確認されている。 2.音声補間を利用したシステムの構築 デモシステムの構築及び評価を行った。感情モーフィングを利用した中間的な感情を生成するシステム、入力歌唱音声のテンポを変更して合成するシステム、入力した音声のスペクトル及び基本周波数を実時間で変換して高品質な合成を行う実時間声質変換システムなどを構築した。特に、実時間声質変換システムについては、主観評価実験等による評価を行った結果を論文として投稿し、採録が決定している。このシステムに用いられている分析合成部分では、高品質音声分析合成方式であるSTRAIGHTをベースとしたものを用いているが、高速化や様々な工夫の導入により、実時間処理が難しいと言われていたSTRAIGHTの実時間処理を可能としている。この分析合成部分の評価を行った所、元のSTRAIGHTに比べれば劣化するものの、既存の分析合成であるケプストラムボコーダに比べて主観評価値のMOSにおいて1程度の品質向上が見られている。
|
Research Products
(6 results)