研究概要 |
本研究は種々の日本語文章の形態素解析、構文解析を通じて、我々の持っている形態素解析プログラム、構文解析プログラムの改良を行い、これらのプログラムを公開することを目的とした。また同時に,これによって解析され文法情報を自動付与された日本語文章のデータベースを作成し、広く自然言語処理研究者に公開することを目的とした. 2年間の研究成果として次のことを達成した. 1.形態素解析プログラムJUMANについて,連語処理機能の追加,標準形態素辞書の整備,標準文法辞書の整備を行い,その成果をJUMAN3.0として平成8年10月に一般に公開した. 2.構文解析プログラムKNPについて,文法記述の枠組の修正,並列構造解析の強化,従属節のスコープ解析の強化,用言に準ずる種々の表現への対応,など種々の改良・修正を行った.この成果は,KNP2.0として平成9年3月に一般に公開した. 3.コーパスに付与する形態素情報,構文情報について基準をまとめ,修正作業者へのマニュアルを作成した. 4.コーパスの人手修正をスムーズに行うことができ,またコーパスに対する種々の検索が可能なマンマシンインターフェースを作成した. 5.自動付与した情報の人手修正を日常的に行い,平成9年3月末までに「正しい」形態素・構文情報を付与したコーパス,約2万文を作成した.このうち,約1万文は平成9年3月に公開した.
|