研究概要 |
1,実環境データベースの整備: 既存の54chマイクロホンアレーと64chのA/D変換器,座標測定装置,全周型カメラを用いて,実音場のデータの収録を行い,そのデータベース化を行った. 2,超指向特性形成アルゴリズムの研究: 移動する音源に対応できるアレー信号処理を開発するため,非線形信号処理に基づくマイクロホンアレーを用いた超指向特性形成アルゴリズムをオンライン化し,計算機シミュレーションおよび実環境においてその評価を行った.その結果,極少数マイクロホン素子を用いて,同数の移動音源を同定することができることを実機にて実証した. 3,音源同定・ブラインド音源分離アルゴリズムの研究: 音源を同定し,かつ音を認識・識別しながら,高精度に音声のみを選別・抽出するアルゴリズムを提案した.また,音源に関する事前情報を必要としないブラインド音源分離処理に関して,音源の位置情報を反映させることによって音源分離処理の高速化・高精度化を図るアルゴリズムを提案した.実環境における実験の結果,多少の残響が存在しても安定に音源を分離抽出可能であることが示された. 4,統合音声認識アルゴリズムの改良: 音源方位・HMMの状態・時間の3次元方向に対して尤度最大化を行う統合音声認識アルゴリズムに関して,複数の発話者が存在する状態に対応できるように,N-best探索法への拡張および改良を行った.特に,複数話者に関する音声認識の尤度にばらつきがある場合、それらをクラスタリングする手法を提案した.特に残響が無いまたは少ない場合においては,提案手法が複数話者の音声認識に関して有効であることを計算機シミュレーションにより実証した.
|