2008 Fiscal Year Annual Research Report
音素変化の影響を受けにくい音声モーフィング技術の研究
Project/Area Number |
20800062
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
森勢 将雅 Kwansei Gakuin University, 理工学研究科, 博士研究員 (60510013)
|
Keywords | 音声分析 / 音声合成 / 声質変換 / 音声モーフィング |
Research Abstract |
本研究は、音声のモーフィング技術を用いて、歌唱やナレーション等の加工を行う基盤技術の確立を目標としている。本年度では、歌声を対象とした制約条件の少ないモーフィング技術の提案と評価、モーフィングの基盤技術となるTANDEM-STRAIGHTの品質と計算速度の改善を目指した検討を行った。また、TANDEM-STRAIGHTを用いたアプリケーション開発用のC言語ライブラリを実装した。 ・前処理の存在しない歌唱モーフィング技術の提案 音声のモーフィングには、モーフィング対象となる2つの事例を対応付ける前処理が存在する。対応付けの作業は、経験者が行った場合でも、数秒の音声に対し数時間を要する膨大な手間がかかる。この作業量の削減を目的として、自動で対応付けるための方法を提案し、評価した。主観評価により、提案した自動化手法は、手動で対応付けた場合とほぼ等価な品質が達成できることを明らかにした。 ・高SNRの音声を対象とした基本周波数分析法の提案 TANDEM-STRAIGHTにおける基本周波数推定は、高精度ではあるものの、速度が不十分であるため、大量のデータを分析するような用途には使えないとされていた。そこで、音声モーフィングにおける入力信号は、スタジオや防音室で録音された雑音の少ないものであるという制約を利用し、高速で高精度に基本周波数を推定できる方法を提案した。音声データベースを用いてこの方法を評価し、従来法よりも高精度でありながら、10倍以上高速に動作できることを示した。 ・TANDEM-STRAIGHTのライブラリ化 STRAIGHTやTANDEM-STRAIGHTは、Matlab上で実装されているため、Matlabを持たない使用者は使うことができず、また計算速度も他言語と比べると遅いという問題がある。C言語のライブラリとして実装することで、TANDEM-STRAIGHTをアプリケーション開発に組み込めるようにした。
|