研究概要 |
本研究は種々の日本語文章の形態素解析、構文解析を通じて、我々の持っている形態素解析プログラム、構文解析プログラムの改良を行い、これらのプログラムを公開することを目的とした。また同時に、これによって解析され文法情報を自動付与された日本語文章のデータベースを作成し、広く自然言語処理研究者に公開することを目的とした. 本年度は2年間の研究期間の最終年として以下のことを行なった. (1)形態解析プログラムJUMANについては,昨年度行なった改良・修正をまとめ,JUMAN3.0として平成8年10月に一般公開した. (2)構文解析プログラムKNPについては,文法記述の枠組の修正,並列構造解析の強化,従属節のスコープ解析の強化,用言に準ずる種々の表現への対応,など種々の改良・修正を行なった.この成果は,KNP2.0として平成9年3月に一般公開した. (3)コーパスに付与する形態素情報,構文情報について基準をまとめ,自動付与した情報の修正作業者へのアニュアルを作成した. (4)自動付与した情報の人手修正を日常的に行ない,平成9年3月末までに「正しい」形態素・構文情報を付与したコーパス,約2万文を作成した.このうち,約1万文は平成9年3月に公開した. 大量文章の自動解析およびその修正作業は,これまでの成果を利用して,そのまま継続していく体制をとっており,プロジェクト終了後も追加版コーパスの公開を続ける予定である.
|