明瞭な自由発話を対象とした頑健な大語彙連続音声認識の研究

Research Project

Project/Area Number	13780284
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Nara Institute of Science and Technology
Principal Investigator	李晃伸奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
Project Period (FY)	2001 – 2002
Project Status	Completed (Fiscal Year 2002)
Budget Amount *help	¥2,400,000 (Direct Cost: ¥2,400,000) Fiscal Year 2002: ¥1,100,000 (Direct Cost: ¥1,100,000) Fiscal Year 2001: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywords	大語彙連続音声認識 / 音声認識エンジン / 話し言葉解析 / 音声対話処理 / 音声入力インタフェース / 音情報処理 / 音声認識エンジンJulius / 話し言葉 / 音声対話 / 音声インタフェース
Research Abstract	自由で明瞭な話し言葉の音声認識のための,頑健かつ高精度な大語彙連続音声認識の研究を行った.最終年度の研究の具体的内容は以下の通りである. 1.記述文法と統計言語モデルを統合した頑健な音声認識アルゴリズムの研究音声認識の言語モデルにおいて,コーパスから出現頻度を学習する統計的言語モデル(N-gram)は,確率に基づく柔軟な認識が可能だが,タスク固有の単語(例:商品検索システムにおける商品名)などの認識が難しい.逆に,発声文パターンをトップダウンに記述する小規模な記述文法はタスク内において高精度であるが,様々なユーザの発話の変動を考慮することが困難である.これに対して,N-gramにおいて文法を併用し,文法上で接続しうる単語のN-gram接続確率を補正する言語モデル統合手法を提案した.評価実験の結果,N-gramのみの場合の80%から88%へ認識精度を改善できた. 2.音声認識アルゴリズムの改善研究担当者が開発している汎用大語彙連続音声認識エンジンJuliusにおいて,(a)音響尤度計算量の削減,(b)話し言葉認識のマルチパス音響モデルの提案,および(c)対話システムのための認識文法の動的切り替え機構の考案,を行った.これにより,話し言葉をより高精度に認識すると共に,ユーザの状態ごとに言語制約を切り換えるより緻密な音声対話インタフェースを構築することができる.この成果は一般に無償公開されており,誰でもプログラムが入手可能である. 3.音声対話システムの構築とデータ収集・評価音声認識エンジンJuliusを用いた音声対話システムを構築し,ユーザの実発話データの収集と評価を行った.エージェントを用いたWeb検索システム,および生駒市コミュニティセンターの音声情報案内システムを構築し,データの収集と性能の評価を行った.コミュニティセンターでは26000発話以上のユーザ発話を収録した.また音声切り出しについて検討を行った.

Report

(2 results)

2002 Annual Research Report
2001 Annual Research Report

Research Products

(21 results)

All Other

All Publications (21 results)

[Publications] 李晃伸, 鹿野清宏, 河原達也: "音素環境独立HMMを用いた混合ガウス分布選択による音響尤度計算量の削減"情報処理学会論文誌. 43巻7号. 2214-2221 (2002)
- Related Report
  2002 Annual Research Report
[Publications] A.Lee, Y.Mera, K.Shikano, H.Saruwatari: "Selective Multi-Path Acoustic Model based on Database Likelihoods"Proceedings of 7^<th> International Conference on Spoken Language Processing (ICSLP2002). 2661-2664 (2002)
- Related Report
  2002 Annual Research Report
[Publications] 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "単語N-gramとネットワーク文法を併用した音声認識アルゴリズムの検討"日本音響学会秋季講演論文集. 3-9-8. 145-146 (2002)
- Related Report
  2002 Annual Research Report
[Publications] 李晃伸, 鹿野清宏: "複数文法の同時認識および動的切り替えを行う認識エンジンJulius/julian-3.3"日本音響学会秋季講演論文集. 3-9-12. 153-154 (2002)
- Related Report
  2002 Annual Research Report
[Publications] 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "タスク文法によるN-gram確率の部分強化を用いた認識アルゴリズムの評価"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 13 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの開発と運用"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 6 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "N-gram確率のタスク文法による部分強化アルゴリズムの評価"日本音響学会春季講演論文集. 2-4-18. 93-94 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 松本洋平, 李晃伸, 猿渡洋, 鹿野清宏: "グルメレシピタスクにおける音声対話エージェントを用いたWeb検索システム"日本音響学会春季講演論文集. 2-4-8. 73-74 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 西原洋平, 西村竜一, 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの評価"日本音響学会春季講演論文集. 2-4-21. 99-100 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "音声対話エージェントによる生駒市コミュニティセンターの案内システム"情報処理学会第65回全国大会講演論文集. 2F-5 (2003)
- Related Report
  2002 Annual Research Report
[Publications] A.Lee, T.Kawahara, K.Shikano: "Julius---An Open Source Real-Time Large Vocabulary Recognition Engine"7th European Conference on Speech Communication and Technology. 1691-1694 (2001)
- Related Report
  2001 Annual Research Report
[Publications] R.Nishimura, K.Komatsu, Y.Kuroda, K.Nagatomo, A.Lee, H.Saruwatari, K.Shikano: "Automatic N-gram Language Model Creation from Web Resources"7th European Conference on Speech Communication and Technology. 2127-2130 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 李晃伸, 米良祐一郎, 鹿野清宏: "Juliusによるマルチパス音韻モデルを用いた対話音声認識"第2回「話し言葉の科学と工学」ワークショップ. 121-128 (2002)
- Related Report
  2001 Annual Research Report
[Publications] 西村竜一, 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた学内案内ロボット用音声対話システムの作成"情報処理学会研究報告(SIG-SLP). 39・16. 93-98 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 住吉貴志, 李晃伸, 河原達也: "音声認識エンジンJulius/JulianのAPI実装"情報処理学会研究報告(SIG-SLP). 37-16. 91-96 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 河原達也, 加藤一臣, 南條浩輝, 李晃伸: "話し言葉音声認識のための言語モデルとデコーダの改善"情報処理学会研究報告(SIG-SLP). 36-3. 15-22 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた自由発話の自動ラベリングにおけるラベル尤度の統計的分析"日本音響学会秋季講演論文集. 2-1-5. 57-58 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "音声認識エンジンJuliusによる自然対話音声の認識"日本音響学会秋季講演論文集. 2-1-14. 75-76 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "自動ラベリングの音韻尤度に基づく音響モデルの改善"日本音響学会春季講演論文集. 2-5-11. 95-96 (2002)
- Related Report
  2001 Annual Research Report
[Publications] 内田賢志, 西村竜一, 李晃伸, 猿渡洋, 鹿野清宏: "学内受付案内タスクにおける音声認識の検討"日本音響学会春季講演論文集. 1-5-24. 47-48 (2002)
- Related Report
  2001 Annual Research Report
[Publications] 李晃伸, 河原達也, 鹿野清宏: "認識エンジンJuliusにおけるマルチパス音韻モデルの実装"日本音響学会春季講演論文集. 2-5-8. 89-90 (2002)
- Related Report
  2001 Annual Research Report

明瞭な自由発話を対象とした頑健な大語彙連続音声認識の研究

Principal Investigator

李 晃伸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)

¥2,400,000 (Direct Cost: ¥2,400,000)

Report

Research Products

[Publications] 李晃伸, 鹿野清宏, 河原達也: "音素環境独立HMMを用いた混合ガウス分布選択による音響尤度計算量の削減"情報処理学会論文誌. 43巻7号. 2214-2221 (2002)

Related Report

[Publications] A.Lee, Y.Mera, K.Shikano, H.Saruwatari: "Selective Multi-Path Acoustic Model based on Database Likelihoods"Proceedings of 7^<th> International Conference on Spoken Language Processing (ICSLP2002). 2661-2664 (2002)

Related Report

[Publications] 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "単語N-gramとネットワーク文法を併用した音声認識アルゴリズムの検討"日本音響学会秋季講演論文集. 3-9-8. 145-146 (2002)

Related Report

[Publications] 李 晃伸, 鹿野清宏: "複数文法の同時認識および動的切り替えを行う認識エンジンJulius/julian-3.3"日本音響学会秋季講演論文集. 3-9-12. 153-154 (2002)

Related Report

[Publications] 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "タスク文法によるN-gram確率の部分強化を用いた認識アルゴリズムの評価"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 13 (2003)

Related Report

[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの開発と運用"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 6 (2003)

Related Report

[Publications] 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "N-gram確率のタスク文法による部分強化アルゴリズムの評価"日本音響学会春季講演論文集. 2-4-18. 93-94 (2003)

Related Report

[Publications] 松本洋平, 李 晃伸, 猿渡 洋, 鹿野清宏: "グルメレシピタスクにおける音声対話エージェントを用いたWeb検索システム"日本音響学会春季講演論文集. 2-4-8. 73-74 (2003)

Related Report

[Publications] 西原洋平, 西村竜一, 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの評価"日本音響学会春季講演論文集. 2-4-21. 99-100 (2003)

Related Report

[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李 晃伸, 猿渡 洋, 鹿野清宏: "音声対話エージェントによる生駒市コミュニティセンターの案内システム"情報処理学会第65回全国大会講演論文集. 2F-5 (2003)

Related Report

[Publications] A.Lee, T.Kawahara, K.Shikano: "Julius---An Open Source Real-Time Large Vocabulary Recognition Engine"7th European Conference on Speech Communication and Technology. 1691-1694 (2001)

Related Report

[Publications] R.Nishimura, K.Komatsu, Y.Kuroda, K.Nagatomo, A.Lee, H.Saruwatari, K.Shikano: "Automatic N-gram Language Model Creation from Web Resources"7th European Conference on Speech Communication and Technology. 2127-2130 (2001)

Related Report

[Publications] 李晃伸, 米良祐一郎, 鹿野清宏: "Juliusによるマルチパス音韻モデルを用いた対話音声認識"第2回「話し言葉の科学と工学」ワークショップ. 121-128 (2002)

Related Report

[Publications] 西村竜一, 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた学内案内ロボット用音声対話システムの作成"情報処理学会研究報告(SIG-SLP). 39・16. 93-98 (2001)

Related Report

[Publications] 住吉貴志, 李晃伸, 河原達也: "音声認識エンジンJulius/JulianのAPI実装"情報処理学会研究報告(SIG-SLP). 37-16. 91-96 (2001)

Related Report

[Publications] 河原達也, 加藤一臣, 南條浩輝, 李晃伸: "話し言葉音声認識のための言語モデルとデコーダの改善"情報処理学会研究報告(SIG-SLP). 36-3. 15-22 (2001)

Related Report

[Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた自由発話の自動ラベリングにおけるラベル尤度の統計的分析"日本音響学会秋季講演論文集. 2-1-5. 57-58 (2001)

Related Report

[Publications] 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "音声認識エンジンJuliusによる自然対話音声の認識"日本音響学会秋季講演論文集. 2-1-14. 75-76 (2001)

Related Report

[Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "自動ラベリングの音韻尤度に基づく音響モデルの改善"日本音響学会春季講演論文集. 2-5-11. 95-96 (2002)

Related Report

[Publications] 内田賢志, 西村竜一, 李晃伸, 猿渡洋, 鹿野清宏: "学内受付案内タスクにおける音声認識の検討"日本音響学会春季講演論文集. 1-5-24. 47-48 (2002)

Related Report

[Publications] 李 晃伸, 河原達也, 鹿野清宏: "認識エンジンJuliusにおけるマルチパス音韻モデルの実装"日本音響学会春季講演論文集. 2-5-8. 89-90 (2002)

Related Report

李晃伸奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)

[Publications] 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "単語N-gramとネットワーク文法を併用した音声認識アルゴリズムの検討"日本音響学会秋季講演論文集. 3-9-8. 145-146 (2002)

[Publications] 李晃伸, 鹿野清宏: "複数文法の同時認識および動的切り替えを行う認識エンジンJulius/julian-3.3"日本音響学会秋季講演論文集. 3-9-12. 153-154 (2002)

[Publications] 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "タスク文法によるN-gram確率の部分強化を用いた認識アルゴリズムの評価"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 13 (2003)

[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの開発と運用"情報処理学会音声言語研究会(SLP)研究報告. SLP-45. 6 (2003)

[Publications] 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "N-gram確率のタスク文法による部分強化アルゴリズムの評価"日本音響学会春季講演論文集. 2-4-18. 93-94 (2003)

[Publications] 松本洋平, 李晃伸, 猿渡洋, 鹿野清宏: "グルメレシピタスクにおける音声対話エージェントを用いたWeb検索システム"日本音響学会春季講演論文集. 2-4-8. 73-74 (2003)

[Publications] 西原洋平, 西村竜一, 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "生駒市コミュニティセンター音声情報案内システムの評価"日本音響学会春季講演論文集. 2-4-21. 99-100 (2003)

[Publications] 西村竜一, 西原洋平, 鶴身玲典, 李晃伸, 猿渡洋, 鹿野清宏: "音声対話エージェントによる生駒市コミュニティセンターの案内システム"情報処理学会第65回全国大会講演論文集. 2F-5 (2003)

[Publications] 李晃伸, 河原達也, 鹿野清宏: "認識エンジンJuliusにおけるマルチパス音韻モデルの実装"日本音響学会春季講演論文集. 2-5-8. 89-90 (2002)