国文学研究のリソースとして、インターネット上で利用できるデジタルアーカイブ(翻刻テキストや原本の影像データなどの古典電子化資料)の所在を捜すための検索システムの開発を行った。 平成13年度は、ページ記述を分析して電子アーカイブの存在を判断するために、当館で蓄積してきた作品名、人名、地名など国文学分野の専門用語を利用して、機知のテキストアーカイブ、画像アーカイブを持つサイトの解説文などの記述内容を分析し、記述表現のパターンを抽出した。 平成14年度は、昨年度の分析結果を元に、国文学汎用の抽出用フィルタjlda_filter(Japanese Literary Digital Archive_filter)を構築した。このフィルターを使って、 1.国文学の作品名などの専門用語と既存のインターネット検索システムを利用して情報収集対象をせばめる 2.国文学用に作成したjlda_filterを利用し、翻刻テキストまたは影像データの存在を判断する という観点から構成される検索システムを開発、評価を行った。 引き続き、収集したページの記述内容を分析することにより、使用した底本や比較参照した異本の情報や翻刻者、撮影した原本の所蔵者などの情報を抽出し、電子化資料の素性に関する情報をデジタルアーカイブのメタ情報として提供した。さらに、このメタ情報を当館で構築している古典の所在情報データベースと照合することにより、原本の所在情報とその電子的複製物であるデジタルアーカイブのネット上の所在情報も検索できるシステムの実験を行った。
|