2003 Fiscal Year Annual Research Report
未登録語を含むタスク外発語を受理する音声認識方式の研究
Project/Area Number |
14380168
|
Research Institution | Waseda University |
Principal Investigator |
匂坂 芳典 早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
|
Co-Investigator(Kenkyū-buntansha) |
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
白井 克彦 早稲田大学, 理工学部, 教授 (10063702)
|
Keywords | 連続音声認識 / 未登録語 / 統計的言語モデル / 階層的言語モデル / 単語クラスモデル / 音韻連接特性 |
Research Abstract |
本年度は、これまでに提案してきた階層化クラス言語モデルを用い、現実的な状況における未登録単語を含むタスク外発話の認識実験を行った。昨年までの実験的検討により、提案している言語モデルの未登録語記述可能性は確かめられているが、名詞全体に対してタスク外の未登録単語を許した場合の講識性能は低い。単語統計量が与えられない場合に性能が劣化するのは当然の理であるが、実際の使用条件でモデルとしてどのような性能劣化が生ずるかを把握する必要がある。提案する言語モデルの振舞いに対してモデルとして望まれる期待値に比べて大きな劣化がある場合はモデル自体の改変が必要となる。 このため、異なる2種類のタスクを用いて、提案した階層化クラス言語モデルのタスク外語彙に対する性能評価を行った。本実験では、十分な適応元コーパスと、少量の適応先コーパスが与えられた場合を想定した。学習コーパスに存在しない適応先タスク中の単語を未登録語にみたて、階層化クラス言語モデルの認識性能を測定した。 この結果、提案したモデルは未登録語なしの評価セットにおいても、従来の単語バイグラムや単語クラスバイグラムと同等の性能が確認できた。また、提案法で未登録語として誤認識された箇所でも、認識結果が正解既知単語と同じ場合や、未登録語仮説の自由度が単語境界認識を成功されている場合等も確認できた。また未登録語が含まれる場合、従来法では認識率が約3割低下するのに対して、未登録語処理能力を持つ本提案法では、約12%の低下に抑えられることが判明した。さらに、未登録語を直接単語辞書に登録した性能(57%の単語再現率)に対して、提案モデルの性能(68.6%の単語同定率)と比較的高い値となった事実からも、提案法の未登録語処理が従来の単語間モデルに悪影響を与えていないことが確認できた。
|