2004 Fiscal Year Annual Research Report
能動的知覚モデルに基づく歌唱レンダリングシステム作成に関する研究
Project/Area Number |
14380165
|
Research Institution | Wakayama University |
Principal Investigator |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
Co-Investigator(Kenkyū-buntansha) |
片寄 晴弘 関西学院大学, 理工学部, 教授 (70294303)
西浦 敬信 立命館大学, 情報理工学部, 助教授 (70343275)
坂野 秀樹 和歌山大学, システム工学部, 助手 (20335003)
西村 竜一 和歌山大学, システム工学部, 助手 (00379611)
高橋 徹 和歌山大学, システム工学部, 研究員
|
Keywords | 高品質音声合成 / 歌唱システム / STRAIGHT / 音声変換 / ビブラート / 表情づけ / 非言語情報 / パラ言語情報 |
Research Abstract |
本基盤研究は、計算機を用いて国際的なコンテストにおいて入賞できるような歌唱合成システムを実現することを、一つの具体的な成果目標として挙げていた。この目標は、2004年6月に国際会議NIME'04 (nternational Conference on New Interfaces for Musical Expression)に併設されて開催された、コンピュータ音楽の聴き比べコンテストであるRENCON'04の自由部門での2位(参加した4種類の合成歌唱システムの中では1位。なお、この部門での優勝システムは商用のシステムでバッハの室内楽曲を演奏した)入賞という成績によって、達成された。この成果の背景には、本基盤研究により可能となった様々な基盤技術の開発がある。本研究の中核となる高品質音声分析変換合成システムSTRAIGHTの品質向上と拡張は、継続的に進められ、音源情報に関する基本的な拡張を、本年度当初のICASSP' 2003でのAMALGAMアルゴリズムとして報告した。AMALGAMアルゴリズムは、STRAIGHTによって初めて可能となった肉声に匹敵する自然性を有する音声モーフィングの品質を更に向上させるための必須技術である。また、歌唱の豊かさの源である一方、モーフィングの障害となっていたビブラートの分解と再合成に基づく"senza vibrato"アルゴリズムを開発し、国際会議ならびに国内の学会で報告した。これらについては、学術雑誌への投稿を進めている。さらに、STRAIGHTの弱点であった基本周波数抽出精度への依存性も、従来の方法を一桁上回る信頼性を有する新たな基本周波数抽出法を開発することにより解消することに成功した。これらの成果は、非言語、パラ言語情報がいかに重要であるかを示すものであるとともに、この方向で更に研究を進めるための基盤を提供するものでもある。また、これらのアルゴリズムの開発と並行して、歌唱音声の収録技術および再生システムの指向性制御のための基盤技術を開発した。
|
Research Products
(5 results)