1999 Fiscal Year Annual Research Report
マイクロホンアレーを用いたハンズフリー音声認識アルゴリズムの研究
Project/Area Number |
11480077
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30263429)
|
Co-Investigator(Kenkyū-buntansha) |
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
陸 金林 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (50230868)
|
Keywords | 音声認識 / マイクロホンアレー / モデル適応 |
Research Abstract |
本年度は、マイクロホンアレーを用いたハンズフリー音声認識アルゴリズムの研究のため実環境における音環境データの収録、音響特性データの収録を行った。さらに、ハンズフリー音声認識のため、以下のアルゴリズムの研究を行った。 1)実環境における音響環境の測定 実際の環境におけるハンズフリー音声認識を実現するためには、環境に存在する多様な音のデータを収録する必要がある。本研究では、80種類の音源データを収録した。また、残響可変室、畳の和室、個人オフィスなどの音響伝達関数の測定を行った。 2)環境音の識別 環境音のデータを用い、環境音を隠れマルコフモデルを用い識別を試みた。ケプストラム分析に基づいた隠れマルコフモデル表現により、80種類の雑音を約90%で識別可能であることを示した。 3)音声認識のための適応型マイクロホンアレービームフォーミング法 適応型アレーの対象信号として音声信号を用いた場合の最適化法について検討し、複数の話者の音素バランス文章から求めた代表的ターゲット信号を用いることにより、より少ない計算量で高い認識性能を得る適応型ビームフォーマを設計できることを示した。 4)残響環境におけるマルチビームマイクロホンアレー マイクロホンアレーは残響のある環境では効果が不十分であるが、反射を有効に使うことでSNR改善することができる。環境に関する予備情報なしに、マルチビームマイクロホンアレーを利用する方法を提案し、さらに、壁のインピーダンスを補正することで大幅な認識性能が得られることを示した。
|
-
[Publications] 三木一浩: "HMUを用いた環境音識別の検討"電子情報通信学会技術研究報告. SP99-106. 79-84 (1999)
-
[Publications] 岡田有加: "音声の長時間スペクトル特性を考慮したアダプティグマイクロホンアレーによる音声認識"電子情報通信学会技術研究報告. SP99-71. (1999)
-
[Publications] 西浦敬信: "実環境における反射音を利用したマルチビームフォーミングの検討"電子情報通信学会技術研究報告. SP99-1333. (2000)
-
[Publications] 中村哲: "実環境におけるハンズフリー音声認識"電子情報通信学会技術研究報告. SP99-1112. 115-120 (1999)
-
[Publications] Panikos Heracleous: "Simultaneous Recognition of Multiple Sound Sources based on 3-D N-best Search Using a Microphone Avray"Eurospeech 99. 9月号. (1999)
-
[Publications] Sotoshi Nakamura: "Recognition of Distant Talking Speech based on 3-D Trellis Search using a Microphone Array and Adaptive Beamforning"Robust 99. 5月号. 219-222 (1999)