プ-シキンのデータが不足しているため、「大尉の娘」の電子テキストを作成し、それに形態素解析を行ってデータベースを作り、これを運用して見出し語でまとめたコンコーダンスを作成した。この産業内容をまとめ、またデータベース全体の体系付けを行って、ロシア文学会の全国大会で発表したが、この発表は平成8年の学会誌(ロシア語ロシア文学研究)への掲載が決まった。 インターネットの爆発的な発展に伴い、世界中に分散していたロシア語データが「仮想図書館」を通じて利用できるようになり、また電子テキスト研究の世界的な現状が明らかになってきた。英語では形態素解析のプログラムや高度に加工されたテキストも公開されているが、ロシア語ではそこまで行かず、テキスト中の文字列検索のレベルと考えられる。このような中で形態素解析を行い、データを体系的に運用できる浦井にシステムは、一歩先を行くものと考えている。 ラヂシチェフの「ペテルブルグからモスクワの旅」のデータ化は若干遅れ気味だが、電子テキストが完成し、作業用のワードフォーム・コンコーダンスも打ち出したので、作品中の高頻度で未登録の語を語形辞書に登録し、形態素解析を行う予定である。なおこの作業の中で、ラヂシチェフが非常に精密な造語法のシステムを使っていることを実感した。ただこれは同時代人にとってもかなりの荷重であったと思われ、これのアンチテ-ゼとしてカラムジン等の明解な語使用が現れたのではなかろうか。
|