研究概要 |
1,実環境データベースの整備: 54chマイクロホンアレーによる実音場データベース利用のためのツールを作成および整備した. 2,音源同定・ブラインド音源分離アルゴリズムの研究: 音源に関する事前情報を必要としないブラインド音源分離処理に関して,音源の位置情報を反映させることによって音源分離処理の高速化・高精度化を図るアルゴリズムを提案し,その手法の実残響環境下における性能評価を行った.その結果,多少の残響が存在しても安定に音源を分離抽出可能であることが示されたものの,フィルタ長を長くすると各狭帯域信号間における独立性の仮定が崩れ,逆に分離性能が劣化してしまうことも分かった.この問題を解決するために,新たに,周波数領域独立成分分析と時間領域独立成分分析とを直列に継続する手法(MSICA)を提案した.本手法を用いることにより、残響が非常に長い場合においても,音源を高精度に分離することが可能となった. さらに,本アルゴリズムをより安定化させるため,線形予測処理とMSICAとを組み合わせ,音質と安定性の両方を満たす手法へ拡張した.実残響下における実験の結果,反復学習の回数に依存すること無く,安定に分離フィルタを求めることができ,その性能が従来法を大きく上回っていることが示された(平均12dBの分離性能). 3,統合音声認識アルゴリズムの改良: 音源方位・HMMの状態・時間の3次元方向に対して尤度最大化を行う統合音声認識アルゴリズムに関して,複数の発話者が存在する状態に対応できるように,N-best探索法への拡張および改良を行った.特に,複数話者に関する音声認識の尤度にばらつきがある場合、それらをクラスタリングする手法を提案した.その手法に関して実機に基づく実験を多少の残響がある場合において実施した.その結果,提案手法が複数話者の音声認識に関して有効であることを実証した.
|