2001 Fiscal Year Annual Research Report
明瞭な自由発話を対象とした頑健な大語彙連続音声認識の研究
Project/Area Number |
13780284
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
李 晃伸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
|
Keywords | 大語彙連続音声認識 / 音声認識エンジンJulius / 話し言葉 / 音声対話 / 音声インタフェース / 音情報処理 |
Research Abstract |
自由で明瞭な話し言葉の音声認識のための、頑健な大語彙連続音声認識(ディクテーション:自動書き起こし)の研究を行った。初年度である本年度は認識システムのアルゴリズム改善、話し言葉モデルの基礎的検証およびデータ収集を行い、成果を挙げた。以下に具体的内容を述べる。 1.話し言葉認識のための音声認識アルゴリズムの改善 多様な話し言葉音声の現象に対処するため、音声認識ソフトウェアJuliusの認識アルゴリズムを拡張した。「あー」「えっと」などの間投語をスキップする透過単語処理、認識結果を入力中に逐次確定する逐次デコーディング、複数の音韻モデルを並列適用するマルチパス音韻モデルに対応したViterbiアルゴリズムの高速化を行った。RWCP対話データベースやATR旅行対話コーパスで評価を行い、対話音声に対する認識精度と処理速度を向上させた。 2.話し言葉用言語モデル・音響モデルの検討 話し言葉の性質をより適切に捉える認識用モデルを、言語および音響の側面から検討した。話題に依存したテキストコーパスをWWWから自動収集して話し言葉言語モデルを自動構築する手法、機械との対話における音声特徴の分析、話し言葉における発話速度と音韻の崩れを考慮した高精度なマルチパス音韻モデルの学習と適用に関する研究を行い、話題や発話速度などの依存モデルを用いることによる認識精度の改善を示した。 3.話し言葉を対象とした音声対話プラットフォームにおけるデータ収集と分析 検証の場として、音声による受付案内対話タスクを設定し、数十人を対象とした実発話データや応答文コーパスの収集を行った。発話速度の変化に伴う認識精度の劣化、無声化などによる音韻の変形、対話用言語モデルの認識率への影響などが明らかになった。 4.認識デコーダーJuliusの実装改善 音声認識に用いられる認識エンジンJuliusの実装改善を行った。外部API整備や記述文法モードとの統合を行い、話し言葉認識のプラットフォームとしての開発を継続中である。
|
Research Products
(11 results)
-
[Publications] A.Lee, T.Kawahara, K.Shikano: "Julius---An Open Source Real-Time Large Vocabulary Recognition Engine"7th European Conference on Speech Communication and Technology. 1691-1694 (2001)
-
[Publications] R.Nishimura, K.Komatsu, Y.Kuroda, K.Nagatomo, A.Lee, H.Saruwatari, K.Shikano: "Automatic N-gram Language Model Creation from Web Resources"7th European Conference on Speech Communication and Technology. 2127-2130 (2001)
-
[Publications] 李晃伸, 米良祐一郎, 鹿野清宏: "Juliusによるマルチパス音韻モデルを用いた対話音声認識"第2回「話し言葉の科学と工学」ワークショップ. 121-128 (2002)
-
[Publications] 西村竜一, 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた学内案内ロボット用音声対話システムの作成"情報処理学会研究報告(SIG-SLP). 39・16. 93-98 (2001)
-
[Publications] 住吉貴志, 李晃伸, 河原達也: "音声認識エンジンJulius/JulianのAPI実装"情報処理学会研究報告(SIG-SLP). 37-16. 91-96 (2001)
-
[Publications] 河原達也, 加藤一臣, 南條浩輝, 李晃伸: "話し言葉音声認識のための言語モデルとデコーダの改善"情報処理学会研究報告(SIG-SLP). 36-3. 15-22 (2001)
-
[Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた自由発話の自動ラベリングにおけるラベル尤度の統計的分析"日本音響学会秋季講演論文集. 2-1-5. 57-58 (2001)
-
[Publications] 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "音声認識エンジンJuliusによる自然対話音声の認識"日本音響学会秋季講演論文集. 2-1-14. 75-76 (2001)
-
[Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "自動ラベリングの音韻尤度に基づく音響モデルの改善"日本音響学会春季講演論文集. 2-5-11. 95-96 (2002)
-
[Publications] 内田賢志, 西村竜一, 李晃伸, 猿渡洋, 鹿野清宏: "学内受付案内タスクにおける音声認識の検討"日本音響学会春季講演論文集. 1-5-24. 47-48 (2002)
-
[Publications] 李 晃伸, 河原達也, 鹿野清宏: "認識エンジンJuliusにおけるマルチパス音韻モデルの実装"日本音響学会春季講演論文集. 2-5-8. 89-90 (2002)