1995 Fiscal Year Annual Research Report
マイクロホンアレイと確率モデルの合成による音声認識アルゴリズムの研究
Project/Area Number |
07221102
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
|
Co-Investigator(Kenkyū-buntansha) |
倉片 憲治 日本学術新興会, 特別研究員PD
伊勢 史郎 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (20211732)
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30263429)
杉山 雅英 会津大学, コンピュータ理工学部, 教授 (90254060)
伊達 玄 会津大学, コンピュータ理工学部, 教授 (50112355)
|
Keywords | 音声認識 / マイクロホンアレイ / 音源確率モデル |
Research Abstract |
音声によるインタフェースは、人間同志の通信に通常使用されているという意味で最も自然で使いやすいインタフェースである。マルチモーダルインタフェースにおいても、音声情報はそれらの情報の要として極めて重要となる。しかしながら、音声認識合成は今だ性能的に不十分で上記の使用のための性能を満たしていない。実環境で使用するためには、次の点が重要となる。 (1)マイクロホンから離れての発声、(2)動きながらの発声、(3)他人の声を含む雑音源のある環境での発声、(4)使用者が発声しているかどうかの判断 我々は、これらの問題に対する鍵は、マイクロホンを意識せずにマイクロホンから離れて発声した音声の認識を可能にすることであると考えている。本研究ではマイクロホンの存在を話者に意識させない、ハンズフリーフリーのより自然な対話音声入力方式の確率を目指して対話音声認識系の入力系および音声処理系における堅牢性の向上について検討を行なうことを目的にしている。 マイクロホンアレイおよび距離依存感度マイクロホンを用いて複数音源から生成される信号を空間的に分析し、さらに複数音源に対する生成源である音源の確率モデル(HMM)を推定し、対象とする音源モデルの強調処理を行ない認識対象とする音声の認識性能、特に堅牢性を向上させることによりハンズフリーの音声インタフェースを実現を試みた。まず、直線型マイクロホンアレーを入力系とする音声認識系の構築、雑音および部屋の伝達関数のHMM合成による実環境における認識系の堅牢性の向上の評価の基礎検討および距離依存感度マイクロホンの改良を行なった。さらに、マイクロホンアレーに関しては、実環境における評価を目指したデータベース構築の準備も行なった。また、アクティブノイズコントロールの検討を行なった。
|
-
[Publications] 山田武志: "マイクロホンアレーを用いた話者方向検出による音声認識" 日本音響学会講演論文集. 7-8 (1995)
-
[Publications] 山田武志: "マイクロホンアレーを用いた話者方向検出による音声認識" 電子情報通信学会音声研究会. SP95-65. 27-34 (1995)
-
[Publications] 滝口哲也: "加法性雑音、伝達特性による歪みを受けた音声のHMM合成による認識" 日本音響学会講演論文集. 3-4 (1995)
-
[Publications] 滝口哲也: "加法性雑音、伝達特性による歪みを受けた音声のHMM合成による認識" 電子情報通信学会音声研究会. SP95-71. 41-46 (1995)
-
[Publications] Satoshi NAKAMURA: "Hands Free Speech Recognition by a Microphone Array and HMM Composition" Proc. IWHIT95 Aizu. 33-38 (1995)
-
[Publications] 赤木伸行: "音響インピーダンス制御によるダクト内騒音の高次モードを考慮したアクティブ制御" 日本音響学会研究発表会講演論文集. 559-560 (1995)
-
[Publications] S.Ise: ""Theory of the Sound Field Reproduction Based on the Kirchhoff-Helmholtz Integral Equation"" Proc. of ICA 95. 85-88 (1995)
-
[Publications] S.Ise: ""Active Non-Reflectional Termination using Adaptive Signal Processing"" Proc. of ACTIVE 95. 407-412 (1995)
-
[Publications] 田岡典尚: "“インターネット上で利用可能な音声認識サーバの構築"" 情報処理学会全国大会. (1996)
-
[Publications] 木村貞弘: "“MOSAICブラウザ-を用いた音声対話システム"" 情報処理学会全国大会. (1996)
-
[Publications] 山田武志: "“マイクロホンアレーを用いた発話者方向検出による音声認識"" 日本音響学会講演論文集. 45-46 (1996)
-
[Publications] 滝口哲也: "“HMM合成を用いた音声認識における残響時間の影響の検討"" 日本音響学会講演論文集. 43-44 (1996)
-
[Publications] 赤木伸行: "ダクト内における複数の二次音源によるアクティブ騒音制御" 日本音響学会講演論文集. 493-494 (1996)
-
[Publications] 田中康治: "時空間的相関を利用した音場の高能率符号化" 日本音響学会講演論文集. 591-592 (1996)
-
[Publications] 田中康治: "最小ノルム解を用いたマルチチャンネル音場制御による局所的な音場の強調" 日本音響学会講演論文集. 507-508 (1996)
-
[Publications] 渡辺真太郎: "ウェーブレット解析によるフラッターエコーの検出" 日本音響学会講演論文集. 847-846 (1996)
-
[Publications] 渡辺真太郎: "ウェーブレット解析による模型実験におけるインパルス応答の補正" 日本音響学会講演論文集. 847-848 (1996)