研究課題/領域番号 |
20K20325
|
配分区分 | 基金 |
研究機関 | 国文学研究資料館 |
研究代表者 |
青田 寿美 国文学研究資料館, 研究部, 准教授 (10309429)
|
研究分担者 |
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
白須 裕之 京都大学, 人文科学研究所, 助教 (30828570)
古勝 隆一 京都大学, 人文科学研究所, 准教授 (40303903)
|
研究期間 (年度) |
2020-04-01 – 2022-03-31
|
キーワード | 蔵書印 / 印影、印章 / 篆字部首検索 / 篆字画像検索 / 蔵書形成、書物流通 / 蔵書印データベース / 篆字部首検索システム / 篆書字体データセット |
研究実績の概要 |
NIJL「蔵書印データベース」に、以下①②の印影データと関連情報を追加・増訂することにより、約4万3千件の蔵書印レコードを対象に高度な検索を実行可能とし、蔵書印影・印主と書物を介した有機的なつながりを可視化する為の情報基盤を整備した。また、③の篆書体文字画像データを作成・精査し、④の「篆書字体データセット」を公開した。⑤の「篆字部首検索システム」を改修し、7千字超の漢字の篆書体用例を容易に検索・表示可能とした。併せて、篆字初学者向けに学習用資料「篆書の例」を増補した「難読篆書字形表」を公開した。 ①武田科学振興財団・杏雨書屋、国立国会図書館デジタルコレクション、聖心女子大学図書館、静岡市立清水中央図書館・徳川文庫、国文学研究資料館及び個人所蔵資料から許諾を得た書誌・書影データ等により、蔵書印レコード数と印影数を増強した。2021年3月末時点での公開件数は、蔵書印レコード数:43,141件、印影数:40,423点(レコード数は約2千1百件の増加、印影数は約2千6百点の増加)。 ②既存レコードの未判読印文につき釈読を進めた。 ③『聯珠篆文』(新潟大学附属図書館所蔵)、『汗簡』(国文学研究資料館所蔵)等から篆書字体画像を切り出し、親字(見出し字)のUnicodeや原本の座標情報等のタグ付け作業を進めた。切り出した画像は約1万6千1百点。また、『偏類六書通』を含む7点の資料につき、切り出した篆書体文字画像データの精査を行った。 ④精査の完了した篆書体文字画像データ約10万6千文字を、ROIS-DS人文学オープンデータ共同利用センター(CODH)の加工・協力により、「篆書字体データセット」としてCODHから公開した。 ⑤「蔵書印データベース」と連携した「篆字部首検索システム」を改修し、検索結果に「篆書字体データセット」で公開中の文字画像データを一覧表示させることで、篆書字体を参照しやすくした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
データ点検が完了し、公開用ライセンスの使用確認が取れた機関の所蔵資料画像7点につき、切り出した篆書字体画像を「篆書字体データセット」としてROIS-DS人文学オープンデータ共同利用センター(CODH)から公開した。対象資料は、ハーバード大学図書館ハーバード燕京図書館所蔵『金石韻府』『セキ古遺文』、新潟大学附属図書館所蔵『聯珠篆文』、お茶の水女子大学附属図書館所蔵『万象千字文』、国文学研究資料館所蔵『汗簡』、国立国会図書館所蔵『韻府古篆彙選』『偏類六書通』。データセットの規模は、篆書体文字画像データ106,448文字、7,681の文字種で、クリエイティブ・コモンズ 表示 - 継承 4.0 国際 パブリック・ライセンス(CC BY-SA)の下に提供を行った。 「篆書字体データセット」を活用し、「篆字部首検索システム」の検索結果に篆書字体画像を表示するよう改修を行った。これまでリンク先でのみ参照可能であった篆字画像が、検索結果画面に一覧表示されることになり、利便性が格段に向上した。表示される篆字画像は上掲の資料画像7点に基づき、従来のリンク表示利用である国立国会図書館デジタルコレクション『漢篆千字文』『偏類六書通』、国文学研究資料館「蔵書印データベース」と併せ利用に供している。 公開済の篆字学習用資料「篆書の例」の篆書字形用例を倍増した「難読篆書字形表(主な難読字と頻出字/主な部首)」を公開し、篆書体読解の補助ツールとした。
|
今後の研究の推進方策 |
篆書字体画像の切り出しを継続して行い、タグ情報等の精査を行った上で、「篆書字体データセット」として順次公開する。「篆書字体データセット」を活用した篆書の字形機械学習の成果により、「篆字画像検索システム(仮称)」の構築と公開を目指す。「蔵書印データベース」および「篆字部首検索システム」にデータの追増と改修を加え、より汎用性のある高度な検索システムの構築を行う。
|
次年度使用額が生じた理由 |
研究期間の最終年度に、適正な研究計画を実行するため。主として、篆書の字形機械学習と「篆字画像検索システム(仮称)」の構築に充当する。
|
備考 |
※「篆書字体データセット」は、人文学研究データリポジトリにても情報公開あり。 Permalink : http://doi.org/10.20676/00000390 info:doi/10.20676/00000390
|