前年度までに、任意の話者の声質を特定話者の声質へと変換する多対一声質変換法として、極少量の音声データを用いた教師無し適応法を提案し、また、特定話者の声質を任意の声質へと変換する一対多声質変換法として、声質制御機能と教師無し適応性能を兼ね備えた変換伝を提案した。今年度は、より柔軟性に優れた変換法として、固有声変換と参照話者に基づく多対多声質変換法を提案した(実施項目1に相当)。また、前年度に引き続き、声質変換技術を用いた様々なアプリケーションを想定し、通常音声、肉伝導音声、キャラクター音声などの収録を行い、データベースの構築を行った(実施項目2に相当)。本データベースを活用し、これまでに提案してきた声質変換法を、多対一変換ボイスチェンジャー、声質制御機能付き一対多変換ボイスチェンジャー、携帯電話音声の帯域拡張、肉伝導音声変換というアプリケーションへと適用した(実施項目3に相当)。これら各想定アプリケーションにおいて、声質変換法の評価を実験的に行い、その高い有効性を確認した(実施項目4に相当)。さらに、これらのアプリケーションの実環境での使用を想定し、実用性の改善に取り組んだ。人対人のコミュニケーションにおける使用では、リアルタイム変換処理や、限られたリソースでも動作するための演算量削減が重要となるため、高品質かつ低演算量で動作するリアルタイム声質変換処理を提案した。さらに.肉伝導音声変換においては、肉伝導マイクの圧着位置の違い等の収録環境変化によりもたらされる音響特性変動を補正するために、教師なし音響特性補正法を提案した。実験的評価により、これら提案法の有効性を確認した。
|