• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

蔵書印データベースの高次利用に向けた情報拡充と篆字学習インターフェイスの開発

研究課題

研究課題/領域番号 20K20325
研究機関国文学研究資料館

研究代表者

青田 寿美  国文学研究資料館, 研究部, 准教授 (10309429)

研究分担者 永崎 研宣  一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
白須 裕之  京都大学, 人文科学研究所, 助教 (30828570)
古勝 隆一  京都大学, 人文科学研究所, 教授 (40303903)
研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード蔵書印 / 印影、印章 / 篆字部首検索 / 篆字画像検索 / 蔵書形成、書物流通 / 蔵書印データベース / 篆字部首検索システム / 篆書字体データセット
研究実績の概要

NIJL「蔵書印データベース」に、以下①②の印影データと関連情報を追加・増訂することにより、約4万4千件の蔵書印レコードを対象に高度な検索を実行可能とし、蔵書印影・印主と書物を介した有機的なつながりを可視化する為の情報基盤を整備した。また、③の篆書体文字画像データを作成・精査し、④の「篆書字体データセット」を公開した。⑤の「篆字部首検索システム」を改修し、7千字超の漢字の篆書体用例を容易に検索し詳細表示を可能とした。
①聖心女子大学図書館、国文学研究資料館及び個人所蔵資料から許諾を得た書誌・書影データ等により、蔵書印レコード数と印影数を増強した。2022年4月時点での公開件数は、蔵書印レコード数:44,120件、印影数:42,923点(レコード数は約1千件の増加、印影数は2千5百点の増加)。
②既存レコードの未判読印文の釈読、印影の書体分類、蔵書印主の人物情報精査を進めた。
③『新撰篆書字典』『印篆貫珠』(国立国会図書館所蔵)、『説文解字』(京都大学人文科学研究所所蔵)、『選集漢印分韻』『朝陽閣字鑑』(早稲田大学図書館)から篆書字体画像を切り出し、親字(見出し字)のUnicodeや原本の座標情報等のタグ付け作業を進めた。切り出した画像は約1万7千8百点。また、『漢篆千字文』を含む6点の資料につき、切り出した篆書体文字画像データの精査を行った。
④精査の完了した篆書体文字画像データ約7万4千文字を、ROIS-DS人文学オープンデータ共同利用センター(CODH)・一般社団法人人文情報学研究所(DHII)の加工により、「篆書字体データセット」のバージョン2としてCODHから公開した。
⑤「蔵書印データベース」と連携した「篆字部首検索システム」を改修し、篆書字体画像の表示方法を改良すると共に、IIIF Curation Viewer上で原本画像とハイライト表示した当該文字が参照可能となった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

データ点検が完了し、公開用ライセンスの使用確認が取れた機関の所蔵資料画像5点につき、切り出した篆書字体画像を「篆書字体データセット」のバージョン2としてROIS-DS人文学オープンデータ共同利用センター(CODH)から公開した。対象資料は、国立国会図書館所蔵『新撰篆書字典』『印篆貫珠』、京都大学人文科学研究所所蔵『説文解字』、早稲田大学図書館所蔵『選集漢印分韻』『朝陽閣字鑑』。データセットの規模は、篆書体文字画像データ74,450文字で、クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)及びクリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際 ライセンス(CC BY-NC-SA)の下に提供を行った。
公開文字種は5,532の増加となり、篆書字体画像の増強分と併せ、ディープラーニングの準備を進めた。
「篆書字体データセット」を活用し、「篆字部首検索システム」の検索結果に篆書字体画像を表示すると共に、個別の文字をクリックすると原本画像に戻り当該文字をハイライト表示するよう改修を行った。これまで画面の表示幅からはみ出る文字は省略されていたが、改修後はスクロールバーにより全点表示可となった他、典籍ごとに一覧表示する方法に切り替えたことで視認性を向上させた。また、篆字の典拠となる原本画像へのリンクを提供することで情報の検証を容易にした。表示される篆字画像は、ハーバード大学図書館ハーバード燕京図書館所蔵『金石韻府』『セキ古遺文』、新潟大学附属図書館所蔵『聯珠篆文』、お茶の水女子大学附属図書館『万象千字文』、国文学研究資料館所蔵『汗簡』、国立国会図書館所蔵『韻府古篆彙選』『偏類六書通』。従来のリンク表示利用である国立国会図書館デジタルコレクション『漢篆千字文』『偏類六書通』、国文学研究資料館「蔵書印データベース」と併せ利用に供している。

今後の研究の推進方策

切り出し済みの篆書字体画像につき継続してタグ情報等の精査を行った上で、「篆書字体データセット」を公開する。「篆書字体データセット」を活用した篆書の字形機械学習の成果により、「篆字画像検索システム(仮称)」の構築と公開を目指す。「蔵書印データベース」および「篆字部首検索システム」にデータの追増と改修を加え、より汎用性のある高度な検索システムの構築を行う。

次年度使用額が生じた理由

コロナ禍による参加予定学会や研究会等の開催形態の変更、また、ディープラーニングに必要な資料の情報収集とオープンデータ化の準備等が生じたため。次年度は、3度目となるディープラーニング実施により、「篆字画像検索システム(仮称)」の構築と公開を目指す。

備考

※「篆書字体データセット」は、人文学研究データリポジトリにても情報公開あり。
Permalink : http://doi.org/10.20676/00000390
info:doi/10.20676/00000390

  • 研究成果

    (6件)

すべて 2021 その他

すべて 雑誌論文 (1件) (うちオープンアクセス 1件) 学会発表 (2件) 備考 (3件)

  • [雑誌論文] 蔵書印について ―篆書の読み方2021

    • 著者名/発表者名
      青田寿美
    • 雑誌名

      日本古典籍講習会テキスト

      巻: 19 ページ: 1 - 14

    • オープンアクセス
  • [学会発表] 【講義5】蔵書印について ―篆書の読み方2021

    • 著者名/発表者名
      青田寿美
    • 学会等名
      第19回 日本古典籍講習会(2021年度)
  • [学会発表] 蔵書家の群像(2)-大きな印と小さな印-2021

    • 著者名/発表者名
      古勝隆一
    • 学会等名
      文研アカデミー2021 連続セミナー『はんこの文字の話 ~人文研の蔵書と蔵書印~』
  • [備考] 蔵書印データベース

    • URL

      http://base1.nijl.ac.jp/~collectors_seal/

  • [備考] 篆字部首検索システム

    • URL

      https://base1.nijl.ac.jp/~collectors_seal/seal_script/

  • [備考] 篆書字体データセット

    • URL

      http://codh.rois.ac.jp/tensho/

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi