本研究の目的は,出現形に対する述語項構造解析技術と,受身形・使役形の格構造と原形格構造を対応付ける知識を組み合わせることで,これまで高い精度で解析することが難しかった受身形・使役形で出現した用言の原形格構造を高精度に解析するシステムを開発することである.本年度は,高精度な出現形と原形の格の対応付け知識の獲得,および,獲得した知識に基づく受身形と能動形の表層格の格変換に取り組んだ.また,省略・照応解析機能も含めた述語項構造解析器を公開した. まず,同一の用言の対応する受身形と能動形の格の用例や分布の類似性に着目し,Webから自動獲得した大規模格フレームと,少数の受身形と能動形の格の変換規則を用いることで,受身形と能動形の表層格の対応付けに関する知識の自動獲得を行った.具体的には,受身形と能動形の間の格交替において交替する格はたかだか2つの格であり,起こりうる交替のタイプは20種以下であるとの分析に基づき,起こりうる変換パターンを人手で記述した上で,69億文から構築した大規模格フレームから得られる類似度情報に基づいて格の対応付け知識の獲得を行った.さらに,自動獲得した知識を受身文の能動文への変換における格変換タスクに適用し,自動獲得した知識を用いることで先行研究の精度を有意に上回ることを示すことにより,自動獲得した知識の有用性を確認した. また,日本語構文・格解析システムKNPに機能追加する形で,省略・照応解析機能も含めた述語項構造解析器の公開を行った.具体的には,共参照解析,ゼロ照応解析,連想照応解析機能を新たにKNPに追加し,さらに,照応解析結果の閲覧に適した出力フォーマットの追加を行った.
|