研究課題/領域番号 |
22650034
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, 大学院・工学研究科, 教授 (20115893)
|
研究分担者 |
山本 一公 豊橋技術科学大学, 大学院・工学研究科, 助教 (40324230)
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)
|
キーワード | 音声のプライバシ保護 / 音声のプライバシ除去 / 音声の除去 / 音質変換 / 固有名除去 / 音楽重量音声 / ベクトル量子化 / NMF |
研究概要 |
監視カメラ等は犯罪防止の観点から社会に受け入れられるが、公共場所での音声や音の収録は社会的に受け入れられていない。これは音声には話者情報や言語情報などプライバシ情報を含んでいるからである。このため、収録音から音声だけを除去し背景音や環境音だけを残す技術、話者性を除去するための背景音中での声質変換技術、発話内容である言語情報から個人名等に対する音声区間の除去技術などが必要である。 本年度は、音楽重量音声から音声だけを除去する二つの手法を開発した。一つはベクトル量子化法に基づく方法で、音楽重量音声とそれに対応する音声をそれぞれベクトル量子化によりコードブックを作成しておき、入力の音楽重量音声に対して、音楽重量音声コードベクトルと対応する音声コードベクトルを同定し、後者を入力音声から差し引く方法である。二つ目の方法は、非負値行列因子分解(NMF)法に基づく方法である。これは、音楽重量音声を音楽と音声の代表的な基底ベクトルの線形和に分解することにより、音楽成分だけを抽出する手法である。SN比0dBの入力混合音に対して、5db程度の向上を得た。本手法を逆に利用すると音楽重量音声の音声認識を行うことができる。SN比0dBの入力に対し、200単語の音声認識で約90%の認識率を得ることができた。
|