本年度は、研究目的の第一に掲げた「探索的データ解析が日本語研究において有効な分析ツールであることを、これまでの計量的日本語研究の成果・知見を検証(追試)することによって確認する」ために、主として、検証(追試)の対象とする計量的な日本語研究の選定を、以下のような要領・手順で、継続して行った。 1.検証(追試)の対象として、計量日本語学研究会編『計量日本語学集成』に収められた1300編あまりの論文等を主たる侯補とし、同CD-ROMを購入した。 2.上記の論文等は、1979〜1999年に発表されたものに限られるので、それ以前・以後に発表された論文等を補うために、主として、国立国語研究所図書館所蔵の文献を調査した。 3.上記1・2で得た論文等から、まず、検証(追試)に耐える具体的なデータを掲げているものを、計量言語学、コーパス言語学等を専攻する大学院生のアルバイトを雇用して、選定した。 4.次いで、それらを、利用している統計手法および日本語研究の分野別(音声・音韻、文字・表記、語彙、文法、文章・文体、方言、言語生活、…)に区分した。 以上の作業を本年度中に完了し、ひきつづき、検証(追試)対象に決定した論文等について、そのデータをパソコンに入力し、フォーマット等を整えてデータベース化することによって、探索的データ解析を適用する準備を終える予定である。
|