2013 年度研究成果報告書

分岐ｎｇｒａｍモデルによる短距離言語モデルから中距離言語モデルへの飛躍

研究課題

研究課題/領域番号	24650063
研究種目	挑戦的萌芽研究
配分区分	補助金
研究分野	知能情報学
研究機関	筑波大学
研究代表者	山本幹雄筑波大学, システム情報系, 教授 (40210562)
研究期間 (年度)	2012-04-01 – 2014-03-31
キーワード	確率的言語モデル / 依存構造 / 機械翻訳
研究概要	声認識や統計的機械翻訳システム等の言語モデルとして、現在、ngram言語モデルが広く利用されているが、このモデルは隣り合った単語の連鎖の確率に基づくモデルである。完全に語彙化しているモデルであるため、局所的な単語の連鎖を精密にモデル化する。しかし、ngram言語モデルは文の構造を無視しているため、中長距離の言語的特長を捉えられない。本研究では、この問題を解決するために、ngram言語モデルに依存構造を統合した生成的依存ngram言語モデルを提案した。すべての依存構造を考慮することによって、任意の次数の依存ngramの確率をEMアルゴリズムによって推定可能とするアルゴリズムを示した。

(2件)