2001 Fiscal Year Annual Research Report
マイクロホンアレーを用いたハンズフリー音声認識アルゴリズムの研究
Project/Area Number |
11480077
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
猿渡 洋 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30324974)
|
Co-Investigator(Kenkyū-buntansha) |
李 晃伸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
|
Keywords | マイクロホンアレー / 音声認識 / ハンズフリー / 音源同定 / 超指向特性 / 雑音抑圧 / 実環境 / ビームフォーミング |
Research Abstract |
1,実環境データベースの整備: 既存の54chマイクロホンアレーと64chのA/D変換器,座標測定装置,全周型カメラを用いて,実音場のデータの収録を行い,そのデータベース化を行った. 2,超指向特性形成アルゴリズムの研究: 移動する音源に対応できるアレー信号処理を開発するため,非線形信号処理に基づくマイクロホンアレーを用いた超指向特性形成アルゴリズムをオンライン化し,計算機シミュレーションおよび実環境においてその評価を行った.その結果,極少数マイクロホン素子を用いて,同数の移動音源を同定することができることを実機にて実証した. 3,音源同定・ブラインド音源分離アルゴリズムの研究: 音源を同定し,かつ音を認識・識別しながら,高精度に音声のみを選別・抽出するアルゴリズムを提案した.また,音源に関する事前情報を必要としないブラインド音源分離処理に関して,音源の位置情報を反映させることによって音源分離処理の高速化・高精度化を図るアルゴリズムを提案した.実環境における実験の結果,多少の残響が存在しても安定に音源を分離抽出可能であることが示された. 4,統合音声認識アルゴリズムの改良: 音源方位・HMMの状態・時間の3次元方向に対して尤度最大化を行う統合音声認識アルゴリズムに関して,複数の発話者が存在する状態に対応できるように,N-best探索法への拡張および改良を行った.特に,複数話者に関する音声認識の尤度にばらつきがある場合、それらをクラスタリングする手法を提案した.特に残響が無いまたは少ない場合においては,提案手法が複数話者の音声認識に関して有効であることを計算機シミュレーションにより実証した.
|
-
[Publications] Hidekazu Kamiyanagida: "Direction of Arrival Estimation Using Nonlinear Microphone Array"IEICE Transactions Fundamentals. Vol.E84-A, No.4. 999-1010 (2001)
-
[Publications] Hiroshi Saruwatari: "Blind Source Separation Combining Frequency-Domain ICA and Beamforming"Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP2001). No. MULT-P2. 2733-2736 (2001)
-
[Publications] Hidekazu Kamiyanagida: "Direction of Arrival Estimation Based on Nonlinear Microphone Array"Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP2001). No. SAM-P7. 3033-3036 (2001)
-
[Publications] Takanobu Nishiura: "Speech Enhancement by Multiple Beamforming with Reflection Signal Equalization"Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing (JCASSP2001). No. SPEECH-L11. 189-192 (2001)
-
[Publications] Panikos Heracleous: "A Microphone Array -Based 3-D N-Best Search Algorithm for the Simultaneous Recognition of Multiple Sound Sources in Real Environments"Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP2001). No. SPEECH-L11. 193-196 (2001)
-
[Publications] Hiroshi Saruwatari: "Blind Source Separation for Speech Based on Fast-Convergence Algorithm with ICA and Beamforming"Proc. of 7^<th> European Conference on Speech Communication and Technology(EUROSPEECH2001). 2603-2606 (2001)
-
[Publications] Hiroshi Saruwatari: "Fast-Convergence Algorithm for ICA-Based Blind Source Separation Using Array Signal Processing"Proc. of 11^<th> IEEE Workshop on Statistical Signal Processing(SSP2001). 464-467 (2001)
-
[Publications] Hiroshi Saruwatari: "Blind Source Separation Based on Fast-Convergence Algorithm Using ICA and Array Signal Processing"Proc. of 3^<rd> International Conference on Component Analysis and Blind Signal Separation. 412-417 (2001)
-
[Publications] Tsuyoki Nishikawa: "Blind Source Separation Based on Multi-Stage ICA Using Frequency-Domain ICA and Time-Domain ICA"Proc. of 3^<rd> International Conference on Fundamentals of Electronics, Communications and Computer Science. (採録決定済,3月発表予定). (2002)
-
[Publications] 猿渡 洋: "(招待論文)アレー信号処理を用いたブラインド信号分離の基礎"電子情報通信学会 電気音響研究会 技術報告書. Vol.EA2001-7. 49-56 (2001)
-
[Publications] 猿渡 洋: "(招待論文)雑音適応型相補的指向特性形成法に基づく非線形マイクロホンアレーを用いた音声強調"電子情報通信学会 音声研究会 技術報告書. Vol.SP2001-68. 43-44 (2001)
-
[Publications] 猿渡 洋: "(招待論文)音声・音響信号を対象としたブラインド音源分離"電子情報通信学会 DSP研究会 技術報告書. Vol.DSP2001-194. 59-66 (2002)
-
[Publications] Toshiya Kawamura: "Blind Source Separation Based on Fast-Convergence Algorithm with ICA and Beamforming"IEICE Technical Report. Vol.EA2001-2. 9-16 (2001)
-
[Publications] 中村 雅也: "マイクロホンアレーを用いた自立移動型ロボットにおける話者位置推定"電子情報通信学会 電気音響研究会 技術報告書. Vol.EA2001-4. 25-32 (2001)
-
[Publications] Tsuyoki Nishikawa: "Comparison of Blind Source Separation Methods Based on Time-Domain ICA Using Nonstationarity and Multistage ICA"IEICE Technical Report. Vol.EA2001-112. 45-52 (2001)
-
[Publications] 上柳 英和: "オンラインアルゴリズムに基づく非線型マイクロホンアレーを用いた移動音源方位推定"電子情報通信学会 電気音響研究会 技術報告書. (3月発表予定). (2002)