研究概要 |
1,実環境データベースの整備: 既存の54chマイクロホンアレーと64chのA/D変換器,座標測定装置,全周型カメラを用いて,実音場のデータの収録を行い,そのデータベース化を行った. 2,超指向特性形成アルゴリズムの研究: アレー信号処理に関する検討として,非線形信号処理に基づくマイクロホンアレーを用いた超指向特性形成アルゴリズムを研究開発し,計算機シミュレーションおよび実環境においてその評価を行った.その結果,極少数マイクロホン素子を用いて,その倍の数の音源を同定することができることを実機にて実証した.また,音源数が素子数と同程度である場合においても,本提案手法は従来の音源定位手法よりも方位分解能の面において非常に優れていることも実験的に示された. 3,音源同定と音声認識の統合的認識アルゴリズムの研究: 音源を同定し,かつ音を認識・識別しながら,高精度に音声のみを選別・認識するアルゴリズムを提案した.実環境における実験の結果,多少の残響が存在しても安定に音源を識別・認識可能であることが示された. 4,統合音声認識アルゴリズムの改良: 音源方位・HMMの状態・時間の3次元方向に対して尤度最大化を行う統合音声認識アルゴリズムに関して,複数の発話者が存在する状態に対応できるように,N-best探索法への拡張を行った.特に残響が無いまたは少ない場合においては,提案手法が複数話者の音声認識に関して有効であることを計算機シミュレーションにより実証した.
|