研究課題
基盤研究(C)
複数のスピーカを用いて「ある位置では日本語が聞こえ,別の位置では英語が聞こえる」ような多言語音声マルチスポット再生技術の研究開発を行っている.従来法では,信号処理に基づく線形フィルタを用いる方式や,マスク信号を重畳する信号処理方式が提案されているが,目的領域外での音漏れや目的領域での音質劣化の課題がある.そこで本研究では,音声合成分野で成功を収めている深層波形生成ニューラルネッ トワーク(以下 NN)を導入し,機械学習によって各スピーカの再生信号を最適に生成する「データ駆動型音声マルチスポット再生方式」を新たに提案する.