本年度は、付加価値を持つデータベースの構築方法を考察・実践することを目的とする本研究の最終年度である。そのため、本年度は、1)画像データ及び電子テキストのマークアップという基本作業に於ける問題点--各作業に時間がかかりすぎるという点--を解決する、2)画像データ・電子テキスト及び出典情報データの三者をリンクさせ、公開するための方法を考察することを中心に研究を進めた。 1)のうち画像データのマークアップについては、昨年度作成したtoolを修正する必要があった。今年度は、プログラムの修正に時間がかかったが、ほぼ完全に機械処理できるようにり、飛躍的に処理スピードが上がった。電子テキストのマークアップについても、TID形式からTIE形式に変換するプログラムで機械的に付加するようになっているタグ情報を追加するという形で、手作業に依存していた点を一部修正した。 2)については、当初は電子テキストに単純に画像をリンクさせることを考えていたが、表示形式を考察しているうち、実用性を高めるために、リンクのための情報を増やす必要があることが判明した。また、1)の機械化でも従来のデータ形式を修正する必要が生じた。そのため、今まで作成してきたデータ及びプログラムに多くの修正を加える必要が生じ、それらの修正が今年度の作業の多くを占めた。 多くの修正を重ねた結果、データ処理を期間内に終了することはできなかったが、かなり実用的なデータベースの形を提示することはできたと考える。完成した部分については、4月中にホームページを作成して公開する予定である。 今年度作成した『詩』の出典データベースを利用した考察は、「『説文解字繋傳』引『詩』考」(『言語文化研究』33号p21〜34印刷中)にまとめた。
|