研究概要 |
本研究は,構文構造の曖昧性解消に利用されてきた語の係り受け関係を句構造文法の統語規則により組み込む方法と,確率文法のパラメタを複合化することにより構文解析の正解率を改善する手法の開発を目的とし,次のような研究成果を得た. 1. 語彙の共起制約を包含する文脈自由文法の構成法 統語範疇(品詞)に基づく自然言語の句構造文法を,(統語範疇,head word,function word)の3組に基づく句構造文法に組み変えることにより,統語範疇の構造制約と語彙の共起制約の両方を満足する文脈自由文法の構成法を提案した.ここで,語彙の共起制約とは語の係り受け関係と文節における付属語の連接条件を指している. この研究成果は,従来難しいとされてきた,語彙の共起制約の句構造文法への組込み法を与えた点で評価に値する成果である. 2. 確率文法の複合化手法の開発 確率文脈自由文法の近似性能を向上するための複合化モデルを提案した.複合化することにより尤度の向上が計れることを示し,また複合化度mおよびm組の確率パラメタ推定式をBaumの不等式を用いて導いた. 確率文脈自由文法の高速構文解析機であるEarleyの手法を拡張して複合化確率文法モデルの構文解析アルゴリズムを構成した. 曖昧な構文構造を生成する文を収集し,正解の構文構造をランダムに選出して,標本集合とし,標本集合からm組の確率パラメタを(1)の推定式に基づいて算出し,(2)の構文解析手法により構文解析を行なって正解率を実験的に算定した.その結果,単独の確率文法を用いることに較べ,複合化確率文法の場合に正解率の向上が顕著であることを実証した.
|