本研究の主要な成果について記す。 1.ソフトウェアの開発・改良 現代日本語の研究に大規模な電子化コーパスを利用することを可能にするためのソフトウェア群を開発・改良した。 すでに前年度までに試作を終えていた『朝日新聞』記事データベースCD-ROM読み出しソフトウェアを改良するとともに、『毎日新聞』CD-ROM、『日本経済新聞』CD-ROMのための読み出しソフトウェアを新規に開発した。これらを用いれば、CD-ROMに収められた膨大な量の新聞記事データを通常のテクストファイルに変換することができる。そうしたテクストファイルに対しては、検索を始めとして任意の処理を施すことができる。 また、語句の用例を検索したり、検索結果を整理・分析するためのソフトウェア群を試作した。 2.事例研究 上記のソフトウェア群を利用して、現代日本語の文法・語彙の具体的な問題についての分析を行った。何種類かの語句の用例を大量に検索して、ソフトウェアを利用して整理・分析し、現実の言語事実に基づいた綿密な記述を追求した。 3.コーパス言語学の方法論についての一般的検討 電子化コーパスを用いた日本語研究は現在萌芽の段階にあるが、今後そうした研究が進むべき方向についての指針を示すべく、コーパスを用いた日本語研究の可能性と問題点について様々な角度から検討し、論文の形で発表した。
|