2009 Fiscal Year Annual Research Report
根拠の記録を伴う書誌データと記述メタデータの効率的作成法・高度活用法に関する研究
Project/Area Number |
20500221
|
Research Institution | University of Tsukuba |
Principal Investigator |
谷口 祥一 University of Tsukuba, 大学院・図書館情報メディア研究科, 教授 (50207180)
|
Keywords | 書誌データ / メタデータ / 根拠記録 |
Research Abstract |
メタデータの品質・信頼性の向上および相互運用性の実現等に向けて、メタデータとそれを構成するデータ項目(要素)値の根拠を値そのものに加えて記録することを提案し、その有効かつ効率的な記録法と高度な活用法をシステム試作や評価実験を通して検証することを目的とする。本年度は、昨年度に引き続き、図書等に対する書誌データ(書誌レコード)を対象とし、根拠記録の作成と活用を試みた。 1.著作同定用根拠記録の作成と活用:同一著作に属する書誌レコード群を機械的に同定するには大きく限界があることを昨年度の実験で確認している。そのため、今年度は先ず人手による著作同定作業を、古典著作など特に同定の困難度が高い著作に対して実施し、同定箇所などを根拠として記録した。併せて、著作同定の基準の明確化(ガイドラインの策定)を図った。次に、こうして同定箇所を記録したレコード群から、個々の著作同定用に集約した根拠記録および同定ルール等を機械的に生成した。これを再度、全レコードに複数の機械学習方式により適用することによって、当該著作および他の著作群の同定性能向上を試みた。加えて、昨年度採用した方式、すなわち個々の書誌レコードから著作同定キーを必要な数だけ生成し同定キーの一致をもって同一著作と機械的に判定する方式との性能比較を行った。 2.書誌レコード作成支援システムの試作:新規リソースに対する情報源コピーに出現する個々の表示要素(単語列)について、その属する書誌的カテゴリ(タイトル、責任表示等の区分)を複数の手法で推定し、推定結果を適切なデータ項目の候補値とするシステムの試作を進めた。レコード作成者が候補として示された値から選ぶことによって、あるいは候補値に修正を加えることによって、データ項目値自体の記録に加えて、値の出所および適用された処理ルール(タスクとアクション)が自動的に根拠として記録されることになる。
|