研究概要 |
確率文法は,自然言語処理において構文解析で発生する曖昧さを解消する一つの手段として用いられているが,一組の確率パラメタで構文解析の正解率を上げるには限度がある.この問題に対処するため,m組の確率パラメタで確率文法を複合化した複合化確率文法で正解率の向上を計る手法の開発が本年度の研究目的であり,以下の研究成果を得た. 1. 複合化確率文法モデルの提案 確率文脈自由文法の近似性能を向上するための複合化モデルを提案した.複合化することにより尤度の向上が計れることを示し,また複合化度mおよびm組の確率パラメタ推定式をBaumの不等式を用いて導いた. 2. 複合化確率文法の構文解析アルゴリズム 確率文脈自由文法の高速構文解析機であるEarleyの手法を拡張して複合化確率文法モデルの構文解析アルゴリズムを構成した. 3. 複合化確率文法による正解率向上の検証 曖昧な構文構造を生成する文を収集し,正解の構文構造をランダムに選出して,標本集合とし,標本集合からm組の確率パラメタを(1)の推定式に基づいて算出し,(2)の構文解析手法により構文解析を行なって正解率を実験的に算定した.その結果,単独の確率文法を用いることに較べ,複合化確率文法の場合に正解率の向上が顕著であることを実証した.
|