研究課題
基盤研究(C)
本研究では語彙レベルの品詞タグと句レベルの機能情報に関する注釈が付与されたKeyakiコーパスを基にHPSGツリーバンクを構築する方法について考察した。Keyakiの注釈付与スキームは特定の言語理論に拠らないが、我々のツリーバンクは主辞駆動句構造文法(HPSG)に基づくことで統語情報だけでなく他の言語情報を付与することができる。こうしたツリーバンクはHPSGパーサーが解析し、言語学者が確認,修正した句構造木から半自動的に作成することができる。
自然言語処理
言語学的な分析に基づいて形式化された文法とコンピュータによって実世界のテキストを大量に解析するために設計されたデータ構造とを結び付けようとする本研究は、精細な統語構造と簡単な意味情報の注釈を各文に付与した日本語ツリーバンクを半自動的に構築した。そして、それがより精細なものとなるように改良を重ねていくことで、言語研究の発展だけでなく情報化社会を支える日本語処理の精度向上にとっても有用な言語資源の開発を目指した。