2005 Fiscal Year Annual Research Report

未登録語を含むタスク外発話を受理する音声認識方式の研究

Research Project

Project/Area Number	14380168
Research Institution	Waseda University
Principal Investigator	匂坂芳典早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
Co-Investigator(Kenkyū-buntansha)	白井克彦早稲田大学, 理工学術院, 教授 (10063702) 小林哲則早稲田大学, 理工学術院, 教授 (30162001)
Keywords	連続音声認識 / 未登録語 / 統計的言語モデル / 階層的言語モデル / 単語クラスモデル / 音韻連接特性
Research Abstract	本研究では、音声認識のための統計的言語モデルとして、辞書に未登録な単語を含む発話を受理する階層化言語モデルを提案する。研究成果としては以下の三点に集約される。 (1)階層化言語モデルの導入文法等に起因する単語間接続制約を与える上位層と、特定の単語クラスの発音を音素もしくは単語系列として受理する下位層の二層構造からなる統計的言語モデルを提案し、その特性を調べた。下層を単語列にまで拡張することにより、従来の未登録語対象である人名・地名と言った単一の単語クラスだけでなく、単語列をも含んだ複数かつ、より一般的な未知固有表現にまで認識対象を拡張した。 (2)階層化言語モデルにおける未登録固有表現認識単一未登録語の音韻連接特性モデルに加え、映画タイトル、書名等に見られるような複数の単語列からなる固有表現(named entity)に対する統計量を同時利用することで、お互いのモデルが相互干渉することなく認識性能を向上することを実験で確認した。 (3)タスク非依存の未登録語認識未登録語として与えられている単語連接環境を考慮した未登録語の統計的な分類(ベクトル量子化)による言語モデルの自動作成法を提案し、音声認識実験によりその有効性を確認した。以上の考案、実験により、統計量を直接求めることができる複数の未登録表現のモデルが相互干渉なく有効に動作し、統計量が明示的に求められないそれら以外に対してのモデル作成法が有効であることを確認した。これらの実験結果は、未登録語を含む音声認識へ有効な解決策を示している。

Research Products
(2 results)

All Journal Article (2 results)

[Journal Article] Speech recognition of a named entity2005
- Author(s)
  T.Tomita, Y.Okimoto, H.Yamamoto, Y.Sagisaka
- Journal Title
  
  Proc.ICASSP2005 Vol.1
  
  Pages: 1057-1060
[Journal Article] Speech Recognition of OOV Expressions and Words2005
- Author(s)
  T.Tomita, Y.Okimoto, H.Yamamoto, Y.Sagisaka
- Journal Title
  
  Proc.SNLP2005 Vol.I
  
  Pages: 273-278