研究概要 |
注釈付けされたコーパス(Treebank)を用いてHPSGに基づく文法を開発する手法を確立し,また現在開発中である英語文法の改良を行った.まず,対象言語や文法理論によらず本手法を用いて文法開発を行うためのツールキットを開発した.これにより,英語文法だけでなく,現在,日本語文法の開発も進んでいる.また,昨年度から開発を行っている英語文法については,文法規則の修正など,さらなる改良を行った.その結果,文法の性能は,99%以上の単語について正しい語彙項目がカバーでき,また84%以上の文について完全正解の構文木をカバーできるようになった.また,曖昧性解消モデルの改良を行い,predicate-argument関係について,ラベル付きで88%,ラベルなしの依存関係のみで91%程度の正解率を達成した.ここで開発した英語の構文解析器は,Enjuとして現在公開している. また,Enjuの応用についても研究を行った.一つは,現在盛んに研究されているSemantic Role Labelingタスクに対してEnjuを適用し,その精度を測定した.既存研究では,CFGに基づく構文解析器を用い,その構文木に対して機械学習(ME, SVMなど)を適用することで,高精度を達成していた.本研究では,機械学習を用いることなく,Enjuの出力を単純にSemantic Roleにマッピングすることで,既存研究を超える精度を達成できることを示した.また,共同研究として,生物学論文からの情報抽出に対してEnjuを適用する研究も行った.Enjuの出力(predicate-argument Structure)の上でのパターン規則を自動獲得する手法を提案し,機械学習のみを用いる既存研究より高い精度を達成することを確認した.
|