研究課題
本研究の目的は、世界最先端のレベルにある音声分析変換合成技術STRAIGHTとその周辺技術を、障害音声、歌唱音声、感情音声、悲鳴などの異常を知らせる音声など、現在の技術レベルでは十分な処理が困難な音声の処理にまで拡張し、音声を用いた人間と人間、人間と機械とのコミュニケーションに生じる様々な困難を克服するための技術基盤を確立するとともに、それらの成果をツール群として適切な形で社会に還元することにある。最終年度にあたる本年度では、前年の最後に拡張された時変多属性任意事例数モーフィングツールの整備、基本周波数分析部分の統計モデルに基づく頑健性の大きな改善、実時間処理機能を利用したツール群の整備、タブレットデバイスへの実装により、当初計画を満足する成果を上げるとともに、計算効率を二倍以上でかつ客観的品質においても主観的品質においても、これまでのTANDEM-STRAIGHTを凌駕するCheap Trickという方法を発明するという、大きな進展があった。さらに、最初に挙げた通常の音声を大きく外れる音声に顕著に現れる周期性からの逸脱を、定量化することのできるまったく新しい表現と原理も発見された。この後者の原理は、最初は、周波数毎のエネルギーの時間重心を表す群遅延という表現において発見されたものであるが、その後、時刻ごとの周波数の平均である瞬時周波数にも、パワースペクトルも同様に成立する、基本的原理であることが明らかとなった。そのため、これらの新しい表現に基づく、処理機構の実装を目標として、新しい研究課題の提案に至った。これは、当初計画を大きく凌ぐ重要な成果である。
26年度が最終年度であるため、記入しない。
すべて 2015 2014 その他
すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 1件、 謝辞記載あり 3件) 学会発表 (43件) (うち招待講演 5件) 図書 (1件) 備考 (2件)
Speech Communication
巻: 67 ページ: 1-7
10.1016/j.specom2014.09.003
音声研究
巻: 18 ページ: 578-588
IEICE transactions on information and systems
巻: E97-D ページ: 3230-3233
http://www.wakayama-u.ac.jp/~kawahara/MatlabRealtimeSpeechTools/
http://www.wakayama-u.ac.jp/~kawahara/STRAIGHTadv/index_j.html