図書館目録における典拠コントロールの一層の充実をめざして、主に以下の3点について研究を実施した。 1. 個人や団体等というエージェントに対する国内の典拠データを仮想的に統合し、より包括的な典拠データとすることを意図し、国立国会図書館作成の著者名典拠データとNACSIS-CAT著者名典拠データの照合、およびリンクする書誌データ間の照合を加えた典拠データの照合を試行した。併せて、国際的な典拠データ間のマッピングとして公開されているVIAFのマッピング結果について妥当性の検証を試み、誤同定や同定漏れの可能性が高い部分を効率的に特定する方法を提示した。 2. 既存の書誌データから著作および表現形に関する事項を抽出し、包括的な著作・表現形典拠データを形成することを意図して、特に難度が高いとされる日本古典著作の著作同定において機械学習の適用を試みた。人手により判定された書誌データ群から有効と思われる項目値を抽出し特徴量とし、個別の著作を予測させる多クラス分類問題として実験した。複数の機械学習モデルと特徴量選択方式を適用し、その有効性と限界を検証した。 3. 統合型の典拠データを適切に表現し管理できるメタデータスキーマの策定に向けて、既提案のメタデータスキーマとメタデータ用の語彙を複数取り上げ、それらの特徴、共通点および相違点、他スキーマへの事後的な変換などの観点から検討した。主にMARC21、RDA語彙を用いたスキーマ、BIBFRAMEなどを対象とした。また、それらの基盤となる概念モデルレベルの検討としてBIBFRAMEとIFLA LRMなどを取り上げ、RDFモデルベースでのクラス間・プロパティ間のマッピングとマージ(併合)を検討した。併せて、メタデータスキーマとしての活用をも視野に入れて、RDAやNCR2018の語彙に対する適切なRDF定義を導く方法論(枠組み)を提示した。
|