科学研究費基盤研究 (C) 「日本語ツリーバンク文法情報の精緻化」では、国立国語研究所共同研究プロジェクト「統語・意味解析コーパスの開発と言語研究」で研究代表者が開発中のコーパス NINJAL Parsed Corpus of Modern Japanese (NPCMJ) にもとづき、さらに正確で詳しい文法情報尾をアノテーションする方法を求める。具体的には、従属節主語の主節主題・主語からの継承、従属節の時制の解釈、および否定文のスコープと焦点、の3つの課題を取り上げ、NPCMJ の検索を利用して真相に迫る。さらに、調査結果にもとづいてこれらの課題に関するアノテーション法を考案し、実際にアノテーションを行う。 昨年度までに引き続き,NPCMJ に対してテンス・アスペクト情報のアノテーションをいかにして付け加えるかという課題を中心とする研究を行った。これまでに,Kamp and Reyle (1993) のディスコース表示理論にもとづくテンス・アスペクト情報のアノテーションを出発点として,日本語の実情に適したアノテーション法を考案した。令和3年度はテクストレベルの時間情報の解釈にとって参照時 (reference time) が決定的な役割を果たすことから,新たにアノテーションに参照時を導入し,さらにテクストの結束関係 (coherence relations) との関係について考察した。これによって,テクスト/ディスコース情報のアノテーションについて新しい展望を開くことができた。
|