池田亀鑑編『源氏物語大成』をテキストとし、すべての文章を単語分割し、品詞情報を付けた『源氏物語』54巻(約38万語)のデータベースを完成し、自立語約21万語、付属語約17万語に関して、それぞれ語彙用例総索引を出版した。また、紫式部日記に関しても、同様のデータベースを完成し、語彙用例総索引を出版した。 更に、『源氏物語』関連文献として、『山路の露』、『雲隠六帖』、『手枕』の文章を単語分割し、品詞情報を付けたデータベースも作成した。加えて、文章データを処理するための種々のプログラムを開発した。 また、これらのデータベースを用いて、『源氏物語』の各巻の文章を統計的に分析し、他作家説のある『源氏物語』の後半の10巻の文章が、品詞の使用率、言葉の使用率等の多くの点で前半の44巻と異なること、また会話文と他の文では、助動詞の用い方に明らかな差があることなど、新しい知見を得た。また、助詞の使用率の変化から、『源氏物語』の執筆開始時期の推定も試みた。
|