2007 Fiscal Year Annual Research Report
包括的な根拠の記録を伴う書誌データとメタデータの効率的作成・高度活用に関する研究
Project/Area Number |
18500186
|
Research Institution | University of Tsukuba |
Principal Investigator |
谷口 祥一 University of Tsukuba, 大学院・図書館情報メディア研究科, 教授 (50207180)
|
Co-Investigator(Kenkyū-buntansha) |
緑川 信之 筑波大学, 大学院・図書館情報メディア研究科, 教授 (70166073)
|
Keywords | 書誌データ / メタデータ / 根拠記録 |
Research Abstract |
知識資源に対する書誌データやWebリソースに対する記述メタデータは、基本的に個々の定義されたデータ項目(データ要素)に対してその採用された値のみを記録している。本研究では、書誌データやメタデータの品質・信頼性、情報表現力を増加させることを意図して、個々のデータ項目の値の記述処理に際して適用された処理ルールやタスクの内容、あるいは値の出所など処理の入出力データを、値の根拠として値そのものに加えて包括的に記録することを提案し、その有効かつ効率的な記録法と高度な活用法の検討およびシステム試作に基づく検証を試みた。図書等に対する書誌データとWebリソースに対する記述メタデータに分け研究を実施することが有効であるため、本年度は書誌データを主対象とした。 1.根拠記録作成自動化・支援:根拠の記録と活用場面を想定したシナリオを設け、シナリオに合致した根拠記録内容を決定し、根拠記録自動化または支援システムおよび根拠活用システムの試作を図った。具体的には、図書資料の主情報源と当該資料に対応する既存の書誌レコードを受け取り、データ項目に記録された値に対して、記述処理を構成する各タスクの処理内容(アクション)と入出力データを推定するシステムを試作し評価した。 2.データ統合処理利用:重複書誌レコード自動判定の問題に対して、書誌レコード同士を比較・照合し、その重複を判定するという、これまでの手法に加えて、根拠の記録(対象資料の主情報源)を活用した照合法を提案し、その有効性検証を試みた。根拠の記録には対象資料の情報源をスキャナで読み込み、OCRソフトを用いてテキストデータ化したものを採用した。システム試作と検証実験を実施した結果、個々の書誌要素レベルでは重複判定の性能値は多少とも向上したが、それらを組み合わせたレコードのレベルでは顕著な向上を示すには至らなかった。
|
Research Products
(4 results)