補助金交付を受けた平成7〜8年度で、(1)ラヂシチェフの「ペテルブルグからモスクワへの旅」(1790年)、(2)カラムジンの「ロシア人旅行者の手紙」(1791-2年)、(3)プ-シキンの「大尉の娘」(1836年)の作品のテキスト((1):118頁、(2):383頁、(3):107頁)を、光学的文字読み取りで電子データにした(もっとも(2)はかなり処理済み)。テキストの性格付けとしては、(1)はそれまでのロシア語の遺産を受け継いだもの、(2)は新しいロシア語の確立を目指したもの、(3)は近代ロシア文学を確立したプ-シキンの代表的な散文となろう。 次にこれらのテキストデータに形態素解析を行ってデータベース化し、辞書的見出し語でまとめたlemmatized concordanceを編集した。この間の作業の概観を示した論文は、学会誌に掲載された(ロシア語ロシア文学研究、第28号、1996、「ロシア語データベースの作成とその運用」)。このコンコーダンスでは、どの語形がどの見出し語に帰属しているかが明示された状態で、各見出し語の出現頻度が示されている。従ってこのデータから見出し語を抽出すると、確実で検証や修正も容易な語彙統計が得られる。 次に上記3つの作品の使用語彙を比較するために、これらの語彙統計を一つにまとめ、そこに参考のためプ-シキン辞典と現代ロシア語頻度辞書での頻度データも追記し、分析を進めた。得られた結果のいくつかは、「成果」の方で示した。なお「研究成果報告書」として、データが一番しっかりしているプ-シキンの「大尉の娘」のlemmatized concordanceを100部印刷して公表することにした。
|