2004 Fiscal Year Annual Research Report
聴覚特性を考慮した音声信号の高品質補間に関する研究
Project/Area Number |
16700183
|
Research Institution | Wakayama University |
Principal Investigator |
坂野 秀樹 和歌山大学, システム工学部, 助手 (20335003)
|
Keywords | 音声補間 / 音声モーフィング / 歌唱合成 / 感情マッピング / 音声分析合成 / スペクトル / 基本周波数 / 距離尺度 |
Research Abstract |
1.スペクトル・基本周波数の変化に関する調査 音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、まず、より簡単な、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにする。 まず、基本周波数のみが異なる音声の収録を行い、基本周波数の制御による劣化要因の調査を行った。ターゲットの基本周波数と原音声の基本周波数との差が大きい場合に劣化が顕著となることが明らかとなった。また、基本周波数を高く変換する場合の品質が、低く変換する場合に比べて高いことも明らかとなった。 また、今年度は、別プロジェクトにより収録した感情音声のデータベースを用い、同一話者におけるスペクトルや基本周波数の感情による変化について調査した。感情の違いによるパラメータ変化をモデル化できれば、感情マッピングという、ある話者の感情に関する情報を、他の話者の平静発話に付与する技術の実現が可能となる。本研究では、この感情マッピングについても検討し、分析結果に基づく感情マッピング手法を提案した。また、振幅スペクトルの特徴点の自動設定方法などについても検討した。 2.歌唱合成のモーフィング・スペクトル制御 歌唱音声は、歌唱音声特有の問題もあるとは言え、基本的にテンポや音程が決まっているため、話声よりも扱いやすい面もあり、検討を進めている。 歌唱には、スタッカートやクレッシェンド、ビブラートなど、様々な奏法があり、これらにより印象を変化させることができる。これらの奏法においては、効果の強さを制御することにより、表現力を向上させることが可能となる。本研究では、奏法の強さを制御するために、異なる奏法間を音声モーフィング技術を用いて補間することを考えている。今年度は、歌唱音声の収録を行い、ビブラートやクレッシェンド・デクレッシェンドに関する検討を行った。
|
Research Products
(5 results)