• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

蔵書印データベースの高次利用に向けた情報拡充と篆字学習インターフェイスの開発

研究課題

研究課題/領域番号 20K20325
配分区分基金
研究機関国文学研究資料館

研究代表者

青田 寿美  国文学研究資料館, 研究部, 准教授 (10309429)

研究分担者 永崎 研宣  一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
白須 裕之  京都大学, 人文科学研究所, 助教 (30828570)
古勝 隆一  京都大学, 人文科学研究所, 准教授 (40303903)
研究期間 (年度) 2020-04-01 – 2022-03-31
キーワード蔵書印 / 印影、印章 / 篆字部首検索 / 篆字画像検索 / 蔵書形成、書物流通 / 蔵書印データベース / 篆字部首検索システム / 篆書字体データセット
研究実績の概要

NIJL「蔵書印データベース」に、以下①②の印影データと関連情報を追加・増訂することにより、約4万3千件の蔵書印レコードを対象に高度な検索を実行可能とし、蔵書印影・印主と書物を介した有機的なつながりを可視化する為の情報基盤を整備した。また、③の篆書体文字画像データを作成・精査し、④の「篆書字体データセット」を公開した。⑤の「篆字部首検索システム」を改修し、7千字超の漢字の篆書体用例を容易に検索・表示可能とした。併せて、篆字初学者向けに学習用資料「篆書の例」を増補した「難読篆書字形表」を公開した。
①武田科学振興財団・杏雨書屋、国立国会図書館デジタルコレクション、聖心女子大学図書館、静岡市立清水中央図書館・徳川文庫、国文学研究資料館及び個人所蔵資料から許諾を得た書誌・書影データ等により、蔵書印レコード数と印影数を増強した。2021年3月末時点での公開件数は、蔵書印レコード数:43,141件、印影数:40,423点(レコード数は約2千1百件の増加、印影数は約2千6百点の増加)。
②既存レコードの未判読印文につき釈読を進めた。
③『聯珠篆文』(新潟大学附属図書館所蔵)、『汗簡』(国文学研究資料館所蔵)等から篆書字体画像を切り出し、親字(見出し字)のUnicodeや原本の座標情報等のタグ付け作業を進めた。切り出した画像は約1万6千1百点。また、『偏類六書通』を含む7点の資料につき、切り出した篆書体文字画像データの精査を行った。
④精査の完了した篆書体文字画像データ約10万6千文字を、ROIS-DS人文学オープンデータ共同利用センター(CODH)の加工・協力により、「篆書字体データセット」としてCODHから公開した。
⑤「蔵書印データベース」と連携した「篆字部首検索システム」を改修し、検索結果に「篆書字体データセット」で公開中の文字画像データを一覧表示させることで、篆書字体を参照しやすくした。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

データ点検が完了し、公開用ライセンスの使用確認が取れた機関の所蔵資料画像7点につき、切り出した篆書字体画像を「篆書字体データセット」としてROIS-DS人文学オープンデータ共同利用センター(CODH)から公開した。対象資料は、ハーバード大学図書館ハーバード燕京図書館所蔵『金石韻府』『セキ古遺文』、新潟大学附属図書館所蔵『聯珠篆文』、お茶の水女子大学附属図書館所蔵『万象千字文』、国文学研究資料館所蔵『汗簡』、国立国会図書館所蔵『韻府古篆彙選』『偏類六書通』。データセットの規模は、篆書体文字画像データ106,448文字、7,681の文字種で、クリエイティブ・コモンズ 表示 - 継承 4.0 国際 パブリック・ライセンス(CC BY-SA)の下に提供を行った。
「篆書字体データセット」を活用し、「篆字部首検索システム」の検索結果に篆書字体画像を表示するよう改修を行った。これまでリンク先でのみ参照可能であった篆字画像が、検索結果画面に一覧表示されることになり、利便性が格段に向上した。表示される篆字画像は上掲の資料画像7点に基づき、従来のリンク表示利用である国立国会図書館デジタルコレクション『漢篆千字文』『偏類六書通』、国文学研究資料館「蔵書印データベース」と併せ利用に供している。
公開済の篆字学習用資料「篆書の例」の篆書字形用例を倍増した「難読篆書字形表(主な難読字と頻出字/主な部首)」を公開し、篆書体読解の補助ツールとした。

今後の研究の推進方策

篆書字体画像の切り出しを継続して行い、タグ情報等の精査を行った上で、「篆書字体データセット」として順次公開する。「篆書字体データセット」を活用した篆書の字形機械学習の成果により、「篆字画像検索システム(仮称)」の構築と公開を目指す。「蔵書印データベース」および「篆字部首検索システム」にデータの追増と改修を加え、より汎用性のある高度な検索システムの構築を行う。

次年度使用額が生じた理由

研究期間の最終年度に、適正な研究計画を実行するため。主として、篆書の字形機械学習と「篆字画像検索システム(仮称)」の構築に充当する。

備考

※「篆書字体データセット」は、人文学研究データリポジトリにても情報公開あり。
Permalink : http://doi.org/10.20676/00000390
info:doi/10.20676/00000390

  • 研究成果

    (11件)

すべて 2021 2020 その他

すべて 雑誌論文 (2件) (うちオープンアクセス 2件、 査読あり 1件) 学会発表 (5件) (うち国際学会 1件、 招待講演 3件) 備考 (4件)

  • [雑誌論文] 段玉裁「古文尚書撰異序」訳注2021

    • 著者名/発表者名
      古勝隆一、田尻健太
    • 雑誌名

      中国思想史研究

      巻: 42号 ページ: 91-123

    • 査読あり / オープンアクセス
  • [雑誌論文] 誰が何を知っておくべきなのか?デジタルアーカイブにおける技術の共有と知識の継承を考える2020

    • 著者名/発表者名
      永崎研宣
    • 雑誌名

      デジタルアーカイブ学会誌

      巻: 4 巻 2 号 ページ: 241-244

    • DOI

      10.24506/jsda.4.2_241

    • オープンアクセス
  • [学会発表] An Improvement of Collaborative Digital Scholarly Edition with IIIF2020

    • 著者名/発表者名
      Nagasaki, Kiyonori; Ohmukai, Ikki; Tomabechi, Toru; Shimoda, Masahiro
    • 学会等名
      Digital Humanities
    • 国際学会
  • [学会発表] コンテンツを起点とする情報の組織化の可能性2020

    • 著者名/発表者名
      永崎研宣
    • 学会等名
      日本図書館研究会情報組織化グループ月例研究会
    • 招待講演
  • [学会発表] SAT大蔵経データベースにおけるIIIFとTEIの活用2020

    • 著者名/発表者名
      永崎研宣
    • 学会等名
      協働型アジア研究オンラインセミナー「IIIFに準拠した画像公開の方法とTEIとの連携」
    • 招待講演
  • [学会発表] 人文学とデジタル人文学 教育をめぐる接点2020

    • 著者名/発表者名
      永崎研宣
    • 学会等名
      京都大学文学研科公開シンポジウム「デジタル人文学の世界へ」
    • 招待講演
  • [学会発表] 蔵書印データベースの高次利用に向けた情報拡充とその展開2020

    • 著者名/発表者名
      青田寿美
    • 学会等名
      総合研究大学院大学日本文学研究専攻「オープンキャンパス(入試説明会)2020」研究紹介ポスター
  • [備考] 蔵書印データベース

    • URL

      http://base1.nijl.ac.jp/~collectors_seal/

  • [備考] 篆字部首検索システム

    • URL

      https://base1.nijl.ac.jp/~collectors_seal/seal_script/

  • [備考] 篆書字体データセット

    • URL

      http://codh.rois.ac.jp/tensho/

  • [備考] 難読篆書字形表(主な難読字と頻出字/主な部首)

    • URL

      https://base1.nijl.ac.jp/~collectors_seal/seal_script/tensho2.pdf

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi