2004 年度研究成果報告書概要

合成音声の品質改善に関する研究

研究課題

研究課題/領域番号	15500118
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	知覚情報処理・知能ロボティクス
研究機関	愛知県立大学
研究代表者	金森康和愛知県立大学, 情報科学部, 助教授 (50230868)
研究期間 (年度)	2003 – 2004
キーワード	音声合成 / 音韻連鎖 / 接続歪 / 韻律制御 / 音質改善 / 自然性 / 遷移過程 / セグメンテーション
研究概要	人間のコミュニケーションにおいて、音声を用いることが最も身近なことである。一方、中国の開放によって、より多くの人が中国語に触れる機会が多くなってくる。中国語の高品質な音声合成システムを求める声が高い。しかし、現在そのようなシステムは研究段階であり、本研究はそのニーズを答えて検討するものである。本研究はデータベースの小型化、音質の改善、音韻連鎖の音韻学などの面からの解明について検討している。本研究は以下のことについて検討を行った。まず、音韻連鎖の検討として、音韻連鎖データを構築することにした。音声合成時の接続歪みを軽減する目的もあるので、従来の研究で分かった接続歪が少ない破裂音などのサンプルは少なく、大きい有声音(母音・半母音間など)については多めにパタンを用意した。録音はまず標準中国語男性話者一人について行った。このデータの音韻セグメンテーションを行った。次に、各音韻連鎖について、前の音韻から後の音韻に遷移するパタンを実際のデータの分析結果から推測し、連鎖モデルを構築した。たとえば、母音から母音の遷移について、第1から第4ホルマントをパラメータとして、多項式曲線で近似したところ、直線の近似よりも、ホルマント合成の自然性をあげることができた。また、特に音韻連鎖時の接続歪を軽減するために、接続区間を従来の極わずかな部分に対して、定常区間から遷移が始めたところを接続の範囲とし、スペクトルやピッチの著しい変化を抑えた。従来の研究では、ホルマント合成器で音源モデルを用いる研究が多かったが、本研究ではできるだけ元の音源を用いることを試み、音質の改善に貢献している。今後は、ホルマント合成器で得た音声と、高品質音声分析・変換・合成システムSTRAIGHTを利用してノンパラメートリクな合成方法で得た音声との比較検討を行う予定である。また、ホルマント合成器で女性の声については難しいといわれているが、これからデータ数を拡張するためにも話者を増やして、その検討を行うつもりである。最後にフレーズや文など長い単位での韻律パタンを制御するアルゴリズムを改良し、音声合成の品質を更に改善する。

研究成果
(2件)

すべて雑誌論文 (2件)

[雑誌論文] Evaluation of Naturalness due to Vowel Connection2005
- 著者名/発表者名
  Yasukazu Kanamori
- 雑誌名
  
  GESTS International Transaction on Acoustic Science and Engineering Vol.5
- 説明
  「研究成果報告書概要(和文)」より
[雑誌論文] Evaluation of Naturalness due to Vowel Connection2005
- 著者名/発表者名
  Kanamori
- 雑誌名
  
  GESTS International Transaction on Acoustic Science and Engineering Vol.5(in printing)
- 説明
  「研究成果報告書概要(欧文)」より