単語・形態素の連接や係り受け・統語構造のような言語の表層的な情報のみを利用した,いわゆる「浅い解析」に基づいた文解析木の蓄積による集合知を指向する「量」を重視したコーパスからではなく,「言語学的に意味のある一般化」に基づく言語情報タグに含まれた情報,いわば「質」を重視したコーパスからこそ言語解析にとっては有用な形式文法が抽出できるのではないだろうか. 本研究では,言語学的な分析に基づく日本語文法の一般化を,コンピュータで日本語テキストを処理する際に必要となる言語情報処理の制約として,主辞駆動句構造文法(Head-driven Phrase Structure Grammar: HPSG)に基づいて形式化することを試みた. こうした独自の問題意識,課題設定から,精細な言語学的分析に基づく情報がタグ付けされたKeyakiツリーバンクを精査することで,Keyakiに頻出する構文・言語現象を個々に確認,検討するとともに,それらが一貫したアノテーション・スキームに基づいてタグ付与されているかという点に注意を払いつつ,そうしたスキームと日本語HPSG文法の原理・規則との対応関係について検討した.特に益岡・田窪の「基礎日本語文法-改訂版-」の各文法項目に該当する用例を中心に,日本語の基本構文のアノテーション情報とHPSG文法の原理的説明との対応関係について精査し,言語学的な一般化を機械可読な文法として実用に結び付ける際に生じるさまざまな問題について考察した. 計画は段階的に進められ,日本語に特徴的な構文に関して主要な単文から一部の複文へと検討対象を順次拡大していくことで,網羅的な調査と体系的な文法の整備を推進しようとした.最終年度では,膠着言語の主要な特徴でありながらも助動詞ほどには検討されてこなかった助詞の連接について検討したが,現象の整理に留まった.
|