2002 Fiscal Year Annual Research Report
古典電子化資料の所在を捜すネット検索エンジンの開発のための基礎技術研究
Project/Area Number |
13680501
|
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
北村 啓子 国文学研究資料館, 整理閲覧部, 助手 (60204913)
|
Keywords | デジタルアーカイブ / ネット検索エンジン / 古典電子化資料 / 所在情報 |
Research Abstract |
補助事業の2年次であり最終年度である今年度は、国文学研究のリソースとして、インターネット上で利用できるデジタルアーカイブ(翻刻テキストや原本の影像データなどの古典電子化資料)の所在を捜すための検索システムの開発並びに調整を行った。 ページ記述を分析して電子アーカイブの存在を判断するために、現在までに当館で蓄積してきた作品名、人名、地名など国文学分野の専門用語を利用した機知のテキストアーカイブ、画像アーカイブを持つサイトの解説文などの記述内容から記述表現のパターンを抽出し、国文学汎用の抽出用フィルタjlda_filter(Japanese Literary Digital Archive_filter)を構築した。 検索システムは、1.国文学の作品名などの専門用語と既存のインターネット検索システムを利用して、情報収集対象をせばめる 2.国文学用に作成したjlda_filterを利用し、翻刻テキスト又は影像データの存在を判断するという観点から構成されている。 また、引き続き収集したページの記述内容を分析することにより、使用した底本や比較参照した本の情報や翻刻者、撮影した原本の所蔵者などの情報を抽出し、電子化資料の素性に関する情報をデジタルアーカイブのメタ情報として提供した。さらに、このメタ情報を当館で構築している古典の所在情報データベースと照合することにより、原本の所在情報とその電子的複製物であるデジタルアーカイブのネット上の所在情報も検索できるシステムの実験を行った。
|
Research Products
(2 results)