研究課題
リアルタイムで声質変換・制御できる次世代ボイスチェンジャー技術とその応用技術の構築を目指し、実施計画1)各要素技術の改善と、実施計画2)各要素技術の統合による次世代ボイスチェンジャー技術とその応用技術の改善に取り組んだ。1)各要素技術の改善:基盤技術を改善するために、変換スペクトルに対する変調スペクトルに基づくポストフィルタを提案し、その有効性を示した。また、変換モデルの学習/評価尺度を改善するために、許容スペクトル変換誤差予測モデルを構築した。さらに、ディジタルシグナルプロセッサ(DSP)上でのリアルタイム変換処理の実装に成功した。2)次世代ボイスチェンジャー技術とその応用技術の改善:各要素技術を統合し、音声生成機能拡張のためのリアルタイム変換技術を構築した。また、応用技術として、A)発声障害者補助のための電気音声強調、B)周囲に迷惑をかけないサイレント音声強調、C)任意の歌手の声質による歌唱を実現する歌声用ボイスチェンジャーの各々に対し、さらなる性能改善を行った。A)電気音声強調においては、ハイブリッド強調法の改善に取り組んだ。さらに、対面会話でも使用できるシステムとして、電気式人工喉頭の出力音源制御技術を構築した。B)サイレント音声強調においては、実環境への適用を目指し、雑音環境下にいる聞き手にも聞き取りやすい変換音声の調査に取り組んだ。その結果、適切な目標音声は、雑音レベルに応じて変化することを示した。C)歌声用ボイスチェンジャーにおいては、知覚年齢制御技術の改善に取り組んだ。歌手の個人性を保持したまま、知覚年齢を手動制御する手法を提案し、その有効性を示した。さらに、差分スペクトルに基づく変換処理を提案し、変換歌声の品質を改善した。本研究成果は高い評価を受け、国際/国内会議において招待講演を2回行い、計2つの国内学会発表賞を受賞した。
25年度が最終年度であるため、記入しない。
すべて 2014 2013 その他
すべて 雑誌論文 (10件) (うち査読あり 8件) 学会発表 (15件) (うち招待講演 1件) 産業財産権 (1件)
IEEE/ACM Transactions on Audio, Speech and Language Processing
巻: Vol.22, No.1 ページ: 172-183
10.1109/TASLP.2013.2286917
IEICE Transactions on Information and Systems
巻: E97-D(6) ページ: 印刷中
エヌ・ティー・エス 次世代ヒューマンインタフェース開発最前線
巻: なし ページ: 227~236
Proceedings of INTERSPEECH
巻: なし ページ: 1057~1061
巻: なし ページ: 1067~1071
巻: なし ページ: 3067~3071
巻: なし ページ: 3072~3076
Proceedings of 8th ISCA Speech Synthesis Workshop (SSW8)
巻: なし ページ: 89~94
Proceedings of SICE 2013
巻: なし ページ: 1602~1603