• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

著作典拠コントロール支援を指向した著作の同定・共有システムの構築

研究課題

研究課題/領域番号 20K12560
研究機関慶應義塾大学

研究代表者

谷口 祥一  慶應義塾大学, 文学部(三田), 教授 (50207180)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード典拠データ / 典拠コントロール / 著作 / 図書館目録 / メタデータ / リンクトデータ
研究実績の概要

図書館目録における網羅的かつ効率的な著作典拠コントロールをめざして、(a)既存の書誌データから著作(および表現形)データを抽出し照合する方式を基本とすること、(b)照合し統合する処理においては、機械学習を含めて複数方式を組み合わせて適用を図ること、(c)同定済み著作データの公開と共有を意図した適切なメタデータスキーマを策定すること、(d)典拠データの作成に用いられる記述規則の機械可読化を図り組み合わせることなどによって、有効な典拠作業支援システムを構築することを研究目的としている。今年度は以下の研究を遂行した。
1. 既存の書誌データからの著作データ抽出と照合:国立国会図書館作成のMARC書誌レコードから日本目録規則2018年版(NCR2018)に従った著作データ・表現形データを機械的に抽出することを、詳細なマッピングの検討を踏まえて実施した。同一著作・表現形の照合と統合は機械的に安定して実施できるレベルでの処理にとどめる方式とした。併せて、著作・表現形データの照合には、対象データを提供された元の形式のまま実行する方式と、リンクトデータを形成した上で実行する方式を並行して試行した。
2. 著作データのスキーマの策定:同定済み著作・表現形データの公開と共有を意図した適切なRDFベースのメタデータスキーマを策定することを目的に、MARCレコードから機械的に抽出・統合した著作・表現形データおよび体現形・個別資料データを、RDFを用いた複数表現方式のリンクトデータに変換して表現した。
3. 典拠データ作成規則の機械可読データ化:NCR2018およびRDAにおける規定群自体をRDFによって表現することを検討し、リンクトデータに変換した。併せて、それらの適用結果である著作データとのリンクや、規定間の参照関係へのネットワーク分析の適用などを試みた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

4つの研究目的(前述の(a)~(d))に対して、今年度新たに下記の成果を得ており、2021年度までの成果と合わせて、おおむね順調に進展していると判断した。
1. 既存の書誌データからの著作データ抽出と照合:策定した詳細なマッピングに基づき、国立国会図書館作成のMARC書誌レコードからNCR2018に依拠した抽出と分割を行い、リンクトデータに変換した。これによって、機械的変換の有効な範囲および課題等を確認することができた。
2. 著作データのスキーマの策定:MARCレコードから機械的に抽出・統合した著作・表現形データおよび体現形・個別資料データを、複数表現方式によるリンクトデータに変換し、その妥当性を検証した。その結果、可能な表現方式およびその特徴・課題等について明らかにすることができた。併せて、リンクトデータ内でのデータの管理情報や由来情報の表現方式について検討し、成果をまとめた。
3. 典拠データ作成規則の機械可読データ化:NCR2018およびRDAにおける規定群自体をRDFによって表現することを検討し、選択肢を提示するとともに、リンクトデータに変換した。こうした試行は海外においても例はなく、成果としてのリンクトデータの活用可能性を含めて、新たな研究の可能性を広げた成果と評価される。
4. 成果公表:上記のそれぞれの成果を雑誌論文として公表するとともに、本研究の一部の成果を反映させた図書の執筆を行った。

今後の研究の推進方策

1. 機械学習を含めた複数方式の組み合わせによる著作データの照合・統合処理の試行:人手で作成したルールに基づくルールベース処理による方式や、機械学習を適用した方式など、複数の照合・統合方式の組み合わせを試行し、性能評価を行う。教師あり機械学習の適用を図るため、学習・評価用データ(正解データ)の整備を図りつつ、効率的な正解データの整備法について検討する。機械学習の適用においては、書誌データが表す対象資料がいずれの著作に属するかを予測させる方式と、書誌データの組み合わせが同一著作を表しているかを予測させる方式などを、有効に組み合わせて適用を図る。
2. 有効な典拠作業支援システムの構築に向けた研究成果の統合:当該補助金による研究計画の最終年度に当たり、これまでに得られた個別の成果を統合し、最終目的である図書館目録における有効な著作典拠コントロール作業支援システムとするための方策を検討し、残された課題等を整理する。

次年度使用額が生じた理由

1. 教師あり機械学習の適用を図るためには、一定量以上の学習・評価用データ(正解データ)が必要となり、既に実験に用いた日本古典著作以外の著作について、人手による整備が必要である。こうした作業には、集合的な特性を有する体現形の扱いなど、データ整備用の基準などが事前に必要となるが、これら基準等が未確定な段階にあるため、データ整備に移行することができなかった。今後、基準等を確定できた段階において、それに依拠した人手によるデータ整備に着手する予定であり、そのための実験補助の経費に充てる。
2. 海外研究協力者との研究打ち合わせはオンライン会議システムを用いて実施しており、そのために旅費が未使用となった。今後は、海外出張し、対面による研究打ち合わせを行う計画である。
3. 得られた成果のうち、英語論文としてその成果公表が可能なものについては概ね海外誌での公表を済ませているが、公表に向けた作業が未着手のものが残されている。これらの原稿執筆に着手し、英語論文原稿の英文校閲費(および、場合によっては論文掲載料)に経費を充てる計画である。

  • 研究成果

    (9件)

すべて 2023 2022 その他

すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (3件) 図書 (1件) 備考 (1件)

  • [雑誌論文] Data provenance and administrative information in library Linked Data: Reviewing RDA in RDF, BIBFRAME, and Wikidata2023

    • 著者名/発表者名
      Shoichi Taniguchi
    • 雑誌名

      Cataloging & Classification Quarterly

      巻: 61 ページ: 67-90

    • DOI

      10.1080/01639374.2023.2178048

    • 査読あり
  • [雑誌論文] Transforming metadata content guidelines and instructions to Linked Data2023

    • 著者名/発表者名
      Shoichi Taniguchi, Akiko Hashizume
    • 雑誌名

      Journal of Information Science

      巻: 49 ページ: -

    • DOI

      10.1177/01655515221142428

    • 査読あり
  • [雑誌論文] JAPAN/MARC書誌レコードからNCR2018エレメントベースのメタデータへの変換2022

    • 著者名/発表者名
      谷口祥一
    • 雑誌名

      Library and Information Science

      巻: 88 ページ: 49-71

    • DOI

      10.46895/lis.88.49

    • 査読あり
  • [雑誌論文] NCR2018の規定間参照関係の実態把握とネットワーク分析の適用2022

    • 著者名/発表者名
      谷口祥一, 橋詰秋子
    • 雑誌名

      日本図書館情報学会誌

      巻: 68 ページ: 233-251

    • DOI

      10.20651/jslis.68.4_233

    • 査読あり
  • [学会発表] 図書館目録のリンクトデータにおけるデータ由来情報と管理情報:RDA in RDF、BIBFRAME、Wikidataの再検討2022

    • 著者名/発表者名
      谷口祥一
    • 学会等名
      三田図書館・情報学会2022年度研究大会
  • [学会発表] JAPAN/MARC書誌レコードからNCR2018エレメントベースのメタデータへの変換2022

    • 著者名/発表者名
      谷口祥一
    • 学会等名
      第70回日本図書館情報学会研究大会
  • [学会発表] RDA 規定のRDF データ化2022

    • 著者名/発表者名
      谷口祥一, 橋詰秋子
    • 学会等名
      2022年度日本図書館情報学会春季研究集会
  • [図書] 知識資源のメタデータへのリンクトデータ・アプローチ2023

    • 著者名/発表者名
      谷口祥一
    • 総ページ数
      -
    • 出版者
      勁草書房
  • [備考] 谷口祥一ホームページ

    • URL

      http://user.keio.ac.jp/~taniguchi/

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi