2013 Fiscal Year Annual Research Report
バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築
Project/Area Number |
22680016
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | 音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / リアルタイム処理 / 自動適応 / バリアフリー |
Research Abstract |
リアルタイムで声質変換・制御できる次世代ボイスチェンジャー技術とその応用技術の構築を目指し、実施計画1)各要素技術の改善と、実施計画2)各要素技術の統合による次世代ボイスチェンジャー技術とその応用技術の改善に取り組んだ。 1)各要素技術の改善:基盤技術を改善するために、変換スペクトルに対する変調スペクトルに基づくポストフィルタを提案し、その有効性を示した。また、変換モデルの学習/評価尺度を改善するために、許容スペクトル変換誤差予測モデルを構築した。さらに、ディジタルシグナルプロセッサ(DSP)上でのリアルタイム変換処理の実装に成功した。 2)次世代ボイスチェンジャー技術とその応用技術の改善:各要素技術を統合し、音声生成機能拡張のためのリアルタイム変換技術を構築した。また、応用技術として、A)発声障害者補助のための電気音声強調、B)周囲に迷惑をかけないサイレント音声強調、C)任意の歌手の声質による歌唱を実現する歌声用ボイスチェンジャーの各々に対し、さらなる性能改善を行った。A)電気音声強調においては、ハイブリッド強調法の改善に取り組んだ。さらに、対面会話でも使用できるシステムとして、電気式人工喉頭の出力音源制御技術を構築した。B)サイレント音声強調においては、実環境への適用を目指し、雑音環境下にいる聞き手にも聞き取りやすい変換音声の調査に取り組んだ。その結果、適切な目標音声は、雑音レベルに応じて変化することを示した。C)歌声用ボイスチェンジャーにおいては、知覚年齢制御技術の改善に取り組んだ。歌手の個人性を保持したまま、知覚年齢を手動制御する手法を提案し、その有効性を示した。さらに、差分スペクトルに基づく変換処理を提案し、変換歌声の品質を改善した。 本研究成果は高い評価を受け、国際/国内会議において招待講演を2回行い、計2つの国内学会発表賞を受賞した。
|
Current Status of Research Progress |
Reason
25年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
25年度が最終年度であるため、記入しない。
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 変調スペクトルを考慮したHMM音声合成2013
Author(s)
高道 慎之介, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲
Organizer
日本音響学会秋季研究発表会
Place of Presentation
豊橋技術科学大学(愛知県豊橋市)
Year and Date
20130925-20130927
-
-
-
-
-
-
-
-