日本語テクストに統辞・意味情報をタグ付けしたコーパスの開発を目指して、現代日本語の多様なデータに適合し、文自動意味解析を行っていくのに十分な統辞情報のタグ付け方法を確立した。実際に、開発した方法に従って 10,000 以上の文に対して統辞・意味解析情報のタグ付けを行った。また、開発した統辞情報タグ付け法を日英両語のマニュアルとして編集した。 統辞情報のアノテーションにおいて問題となる事柄のうち、特に重要な、1個の助詞相当の連語、1個のモーダル助動詞相当の連語、および空要素の扱いについて検討を行った。
|