2008 年度実績報告書

ウェブドキュメントを利用した音声認識結果の信頼度推定と音声認識の高精度化

研究課題

研究課題/領域番号	19700184
研究機関	福岡大学
研究代表者	高橋伸弥福岡大学, 工学部, 助教 (40330899)
キーワード	音声認識 / 言語モデル / スペクトラルクラスタリング / ニュース音声 / 音声認識信頼度 / 言語モデル自動構築 / 動的代替パス探索 / ウェブドキュメント
研究概要	ニュース音声に対する高精度な自動索引付けを目的として、その内容に類似したウェブドキュメントを自動的に収集し、ニュース音声専用の言語モデルを構築する手法について検討した。具体的には、前年度までに検討したウェブドキュメントの収集方式および収集された文書をトピックごとにクラスタリングする方式について比較検討を行い、提案手法で用いるスペクトラルクラスタリングの有効性を確認した。またクラスタリングされた収集文書集合の分散から、検索に用いた語句の認識精度を推定することにより、収集文書の信頼性を判断することを検討し、信頼性の高い文書を用いることで認識精度を高めることができることを示した。またニュース文書を対象として収集された文書の中には3連接以上の熟語や固有名詞を含んだ名詞句が現れるケースが多く見られることから、従来の統計的言語モデルで用いられる3gramモデルをそのまま利用するのではなく、熟語や名詞句をそのままの形で言語モデルに未知語として登録する手法が有効であるとの予想を得ることができた。上記、提案手法では学習データが小〜中規模になってしまうことから、統計的言語モデルの学習データとしては不十分であると考えられるため、既存の統計的言語モデルと併用するためのネットワーク文法の自動構築手法についても検討した。さらに、ネットワーク文法構築の際の問題点である未知語および未知の文パターンに対する対応策を検討し、その有効性について検討したものを国内外の学会で発表した。

研究成果
(2件)

すべて 2009 2008

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (1件)

[雑誌論文] Automatic Construction of a FSA Language Model and Speech Recognition on it with Dynamic Alternative Path Search2009
- 著者名/発表者名
  S. Takahashi, T. Morimoto
- 雑誌名
  
  Proc. of the Int. Multi-Conference on Engineer and Computer Science 1
  
  ページ: 611-615
- 査読あり
[学会発表] FSA言語モデルの自動構築と動的代替パスサーチによる音声認識2008
- 著者名/発表者名
  高橋伸弥、森元逞
- 学会等名
  情報処理学会音声言語情報処理研究会
- 発表場所
  東京工業大学
- 年月日
  2008-10-24