研究概要 |
言語学から言語処理研究にいたる様々な基礎・応用分野に役立つコーパスへのタグ付けを行うための支援環境を構築する.形態素,構文,意味,文脈情報等の様々なレベルのタグ付けを対象とし, (1)タグ付けの自動化と, (2)コーパスへタグ付けを行う際の効率や精度を管理・維持するための支援環境の構築という2つの次元から問題を整理する.前者については,単語分かち書き,品詞付与,文節や固有表現の解析,係り受け解析等の構文解析,用言および体言に対する項構造解析,照応解析等の指示対象の解析,文書構造や談話構造解析など,さまざまな言語情報についてのタグ設計およびタグ付け基準の設定を行う.異なるレベルの整合性を保ちつつ記述するための統合的なタグ付け方式の設計を行う.後者については,設計されたタグ方式に従ってコーパスを作成しつつ,タグ付きコーパスからの機械学習に基づいてタグ付けの自動化を行う言語解析システムの構築と、タグ付きコーパスを管理し,利用するための支援ツールの設計と開発を行う.
|