2000 Fiscal Year Annual Research Report
マイクロホンアレーを用いたハンズフリー音声認識アルゴリズムの研究
Project/Area Number |
11480077
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
猿渡 洋 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30324974)
|
Co-Investigator(Kenkyū-buntansha) |
李 晃伸 奈良先端科学技術大学院大学, 情報科学研究科, 助手
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
|
Keywords | マイクロホンアレー / 音声認識 / ハンズフリー / 音源同定 / 超指向特性 / 雑音抑圧 / 実環境 / ビームフォーミング |
Research Abstract |
1,実環境データベースの整備: 既存の54chマイクロホンアレーと64chのA/D変換器,座標測定装置,全周型カメラを用いて,実音場のデータの収録を行い,そのデータベース化を行った. 2,超指向特性形成アルゴリズムの研究: アレー信号処理に関する検討として,非線形信号処理に基づくマイクロホンアレーを用いた超指向特性形成アルゴリズムを研究開発し,計算機シミュレーションおよび実環境においてその評価を行った.その結果,極少数マイクロホン素子を用いて,その倍の数の音源を同定することができることを実機にて実証した.また,音源数が素子数と同程度である場合においても,本提案手法は従来の音源定位手法よりも方位分解能の面において非常に優れていることも実験的に示された. 3,音源同定と音声認識の統合的認識アルゴリズムの研究: 音源を同定し,かつ音を認識・識別しながら,高精度に音声のみを選別・認識するアルゴリズムを提案した.実環境における実験の結果,多少の残響が存在しても安定に音源を識別・認識可能であることが示された. 4,統合音声認識アルゴリズムの改良: 音源方位・HMMの状態・時間の3次元方向に対して尤度最大化を行う統合音声認識アルゴリズムに関して,複数の発話者が存在する状態に対応できるように,N-best探索法への拡張を行った.特に残響が無いまたは少ない場合においては,提案手法が複数話者の音声認識に関して有効であることを計算機シミュレーションにより実証した.
|
-
[Publications] 西浦敬信: "CSP法による音源位置同定を備えたマルチビームフォーミング"電子情報通信学会論文誌. Vol.J83-D-II,No.7. 1610-1619 (2000)
-
[Publications] 西浦敬信: "マイクロホンアレーを用いたCSP法による複数音源位置推定"電子情報通信学会論文誌. Vol.J83-D-II,No.8. 1713-1721 (2000)
-
[Publications] 西浦敬信: "反射音を利用したマルチビームフォーミングによる音声認識"電子情報通信学会論文誌. Vol.J83-D-II,No.11. 2198-2205 (2000)
-
[Publications] 三木一浩: "マイクロホンアレーとHMM分解・合成法による雑音・残響下音声認識"電子情報通信学会論文誌. Vol.J83-D-II,No.11. 2206-2214 (2000)
-
[Publications] Hidekazu Kamiyanagida: "Direction of Arrival Estimation Using Nonlinear Microphone Array"IEICE Transactions Fundamentals. Vol.E84-A,No.4(発表予定). (2001)