2014 Fiscal Year Annual Research Report
聴覚の情報表現に基づく高度音声分析変換合成方式の研究
Project/Area Number |
24300073
|
Research Institution | Wakayama University |
Principal Investigator |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
Co-Investigator(Kenkyū-buntansha) |
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
坂野 秀樹 名城大学, 理工学部, 准教授 (20335003)
榊原 健一 北海道医療大学, 心理科学部, 准教授 (80396168)
森勢 将雅 山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 音声情報処理 / 音声分析 / 音声変換 / 標本化 / テクスチャ |
Outline of Annual Research Achievements |
本研究の目的は、世界最先端のレベルにある音声分析変換合成技術STRAIGHTとその周辺技術を、障害音声、歌唱音声、感情音声、悲鳴などの異常を知らせる音声など、現在の技術レベルでは十分な処理が困難な音声の処理にまで拡張し、音声を用いた人間と人間、人間と機械とのコミュニケーションに生じる様々な困難を克服するための技術基盤を確立するとともに、それらの成果をツール群として適切な形で社会に還元することにある。最終年度にあたる本年度では、前年の最後に拡張された時変多属性任意事例数モーフィングツールの整備、基本周波数分析部分の統計モデルに基づく頑健性の大きな改善、実時間処理機能を利用したツール群の整備、タブレットデバイスへの実装により、当初計画を満足する成果を上げるとともに、計算効率を二倍以上でかつ客観的品質においても主観的品質においても、これまでのTANDEM-STRAIGHTを凌駕するCheap Trickという方法を発明するという、大きな進展があった。さらに、最初に挙げた通常の音声を大きく外れる音声に顕著に現れる周期性からの逸脱を、定量化することのできるまったく新しい表現と原理も発見された。この後者の原理は、最初は、周波数毎のエネルギーの時間重心を表す群遅延という表現において発見されたものであるが、その後、時刻ごとの周波数の平均である瞬時周波数にも、パワースペクトルも同様に成立する、基本的原理であることが明らかとなった。そのため、これらの新しい表現に基づく、処理機構の実装を目標として、新しい研究課題の提案に至った。これは、当初計画を大きく凌ぐ重要な成果である。
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
Causes of Carryover |
26年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
26年度が最終年度であるため、記入しない。
|
Research Products
(49 results)