本年度の成果としては、次の二点があげられる。 第一に、初年度に作成した二葉亭四迷「浮雲」再版本の電子データを元にして、語彙索引のデータベースをほぼ構築し終えたことである。 第二には、「浮雲」本文の初出版と再版本との異同を一覧として示す電子データを作成したことである。 第一点の意義としては、次の三つが指摘できる。 まず、一般公開するにはまだ加工・整備を必要とするものの、本邦初の「浮雲」の語彙索引であり、国語学や国文学の研究に資するところ、きわめて大である。 二つめに、従来の紙媒体の索引とは異なり、電子データベース化にすることにより表記別・語形別・語構成別の検索も可能であり、本文の電子データと組み合わせれば、文脈検索も可能となり、利便性が格段に向上するであろう。 三つめに、既存の形態素解析ソフトではなじまない本文の時代的な性質(たとえば、文語と口語の混在や、本文とルビによる表記など)に対応するための分節化の手法を開発したことも、今後のデータベース作成の際の参考となることが期待される。 第二点の意義としては、当時の活版印刷の混乱状況をふまえて、作者の元原稿と活字工の作業そして版権などとの関係を考えるうえで、さほど時間を経ずに出版された初出版と再版本との異同を明らかにしたことは、その重要な手掛かりを提供することになると考えられる。
|