研究概要 |
本年度は,ディジタル音声通信における音声符号化方式との親和性を考慮し,携帯電話等の移動通信システムで使用されるCELP(符号励振線形予測)符号化方式により符号化された音声情報に基づく新たな話者照合アルゴリズムを提案した.提案方式では,移動通信システムにおいて照合のために必要な機能の追加が抑えられること,話者の発話内容に依存しないテキスト独立型の話者照合が可能なことが特徴として挙げられる.提案方式は,CELP符号化方式により符号化を行うCELP符号化ブロック,符号化された音声を用いて話者照合を行う話者照合ブロックにより構成される.CELP符号化ブロックでは,入力音声をCELP符号化方式により符号化し,話者の個人性を反映する調音運動を表す符号化パラメータの一つであるLSP(線スペクトル対)を抽出する.なお,本研究ではCELP符号化方式の一例として,ITU-T勧告G.729として標準化されているCS-ACELP符号化方式を検討対象とした.一方,話者照合ブロックは登録プロセスおよび照合プロセスにより構成される.登録プロセスでは,入力音声から抽出した登録用LSPに対して話者の個人性を強調する前処理を施した後,クラスタリングにより特徴コードブックを作成し,これを話者の個人性情報として登録する.照合プロセスでは,登録プロセスと同様に前処理を施した照合用LSPを特徴コードブックでベクトル量子化し,量子化誤差に基づき話者照合を行う.20名の話者から採取した音声による信頼性評価実験を行った結果,登録時,照合時の音声長がそれぞれ90秒,6秒の条件下で等誤り率(EER)の値が3%となり,提案方式により,符号化された音声のみを用いてテキスト独立型の話者照合を実現できる可能性が確認された.今後の課題として,録音音声を用いたなりすましやノイズ,経時変化に対する対策などが挙げられる.
|