2002 Fiscal Year Annual Research Report
明瞭な自由発話を対象とした頑健な大語彙連続音声認識の研究
Project/Area Number |
13780284
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
李 晃伸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
|
Keywords | 大語彙連続音声認識 / 音声認識エンジン / 話し言葉解析 / 音声対話処理 / 音声入力インタフェース / 音情報処理 |
Research Abstract |
自由で明瞭な話し言葉の音声認識のための,頑健かつ高精度な大語彙連続音声認識の研究を行った.最終年度の研究の具体的内容は以下の通りである. 1.記述文法と統計言語モデルを統合した頑健な音声認識アルゴリズムの研究 音声認識の言語モデルにおいて,コーパスから出現頻度を学習する統計的言語モデル(N-gram)は,確率に基づく柔軟な認識が可能だが,タスク固有の単語(例:商品検索システムにおける商品名)などの認識が難しい.逆に,発声文パターンをトップダウンに記述する小規模な記述文法はタスク内において高精度であるが,様々なユーザの発話の変動を考慮することが困難である.これに対して,N-gramにおいて文法を併用し,文法上で接続しうる単語のN-gram接続確率を補正する言語モデル統合手法を提案した.評価実験の結果,N-gramのみの場合の80%から88%へ認識精度を改善できた. 2.音声認識アルゴリズムの改善 研究担当者が開発している汎用大語彙連続音声認識エンジンJuliusにおいて,(a)音響尤度計算量の削減,(b)話し言葉認識のマルチパス音響モデルの提案,および(c)対話システムのための認識文法の動的切り替え機構の考案,を行った.これにより,話し言葉をより高精度に認識すると共に,ユーザの状態ごとに言語制約を切り換えるより緻密な音声対話インタフェースを構築することができる.この成果は一般に無償公開されており,誰でもプログラムが入手可能である. 3.音声対話システムの構築とデータ収集・評価 音声認識エンジンJuliusを用いた音声対話システムを構築し,ユーザの実発話データの収集と評価を行った.エージェントを用いたWeb検索システム,および生駒市コミュニティセンターの音声情報案内システムを構築し,データの収集と性能の評価を行った.コミュニティセンターでは26000発話以上のユーザ発話を収録した.また音声切り出しについて検討を行った.
|
Research Products
(10 results)
-
[Publications] 李晃伸, 鹿野清宏, 河原達也: "音素環境独立HMMを用いた混合ガウス分布選択による音響尤度計算量の削減"情報処理学会論文誌. 43巻7号. 2214-2221 (2002)
-
[Publications] A.Lee, Y.Mera, K.Shikano, H.Saruwatari: "Selective Multi-Path Acoustic Model based on Database Likelihoods"Proceedings of 7^<th> International Conference on Spoken Language Processing (ICSLP2002). 2661-2664 (2002)
-
[Publications] 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "単語N-gramとネットワーク文法を併用した音声認識アルゴリズムの検討"日本音響学会秋季講演論文集. 3-9-8. 145-146 (2002)
-
[Publications] 李 晃伸, 鹿野清宏: "複数文法の同時認識および動的切り替えを行う認識エンジンJulius/julian-3.3"日本音響学会秋季講演論文集. 3-9-12. 153-154 (2002)
-
[Publications] 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "タスク文法によるN-gram確率の部分強化を用いた認識アルゴリズムの評価"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 13 (2003)
-
[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの開発と運用"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 6 (2003)
-
[Publications] 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "N-gram確率のタスク文法による部分強化アルゴリズムの評価"日本音響学会春季講演論文集. 2-4-18. 93-94 (2003)
-
[Publications] 松本洋平, 李 晃伸, 猿渡 洋, 鹿野清宏: "グルメレシピタスクにおける音声対話エージェントを用いたWeb検索システム"日本音響学会春季講演論文集. 2-4-8. 73-74 (2003)
-
[Publications] 西原洋平, 西村竜一, 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの評価"日本音響学会春季講演論文集. 2-4-21. 99-100 (2003)
-
[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "音声対話エージェントによる生駒市コミュニティセンターの案内システム"情報処理学会第65回全国大会講演論文集. 2F-5 (2003)