2018 Fiscal Year Annual Research Report
蔵書印データベースの高次利用に向けた情報拡充と篆字学習インターフェイスの開発
Project/Area Number |
18H05304
|
Allocation Type | Single-year Grants |
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
青田 寿美 国文学研究資料館, 研究部, 准教授 (10309429)
|
Co-Investigator(Kenkyū-buntansha) |
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
古勝 隆一 京都大学, 人文科学研究所, 准教授 (40303903)
白須 裕之 京都大学, 人文科学研究所, 助教 (30828570)
|
Project Period (FY) |
2018-06-29 – 2022-03-31
|
Keywords | 蔵書印 / 印影、印章 / 篆字部首検索 / 篆字部首・画像検索 / 蔵書形成、書物流通 / 蔵書印データベース / 篆字部首検索システム / 篆字データセット |
Outline of Annual Research Achievements |
NIJL「蔵書印データベース」に、以下①②の検索項目と関連情報を追加・増訂した他、約4万件の蔵書印レコードを対象に検索項目の多様化と検索機能の拡張を行い、印文の判読効率を向上させた。また、④で作成した情報を元に、③の「篆字部首検索システム」を構築しβ版として公開することで、篆書体の読解と学習効果を助長するインターフェイスの基盤を作った。併せて、④の篆字データを用い、ディープラーニングの試験運用⑤を実施した。 ①国文学研究資料館所蔵および愛知教育大学附属図書館等から提供を受けた書誌・書影データにより、蔵書印レコード数および印影数を増強した。2019年3月末時点での公開件数は、蔵書印レコード数:39,686件、印影数:35,148点(レコード数は約1千件の増加、印影数は約2千点の増加)。また、[典拠画像URL]の項目を新規公開することで、京都大学附属図書館・谷村文庫との相互リンクを実現し、蔵書印情報と書影等を参照できるよう改良した。 ②既存の蔵書印レコードのうち1~20文字の印影を対象に、[印文行数][印文改行表記][印影外郭]の採録を進め、延べ約3万4千件のレコードにおいて上掲3要件の検索を可能とした。また、印影の[書体]を検索する機能を追加し、延べ約1万6千件を検索可能とした。 ③「蔵書印データベース」と連携した「篆字部首検索システム(テキスト検索β版)」を公開し、単漢字検索と部首検索によって篆字の用例を容易に検索でき学習効果が高まると期待される。 ④国立国会図書館所蔵『漢篆千字文』『偏類六書通』から篆字画像を切り出し、親字(見出し字)のUnicodeや原本の座標情報等のタグ付け作業を進めた。切り出した画像は約4万8千点、文字種は延べ約6千6百文字。 ⑤篆字画像の字形機械学習につき、④の『漢篆千字文』篆字データを用いたディープラーニングの試験運用を実施し、問題点の精査と分析を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね当初の計画通り進捗し、順調に研究が進展していると判断できるため。なお、篆字画像の切り出し対象として、当初予定していた『漢篆千字文』(国立国会図書館デジタル化資料・約2百コマ)に加えて、『偏類六書通』(国立国会図書館デジタル化資料・約5百コマ)の切り出しとタグ付け作業を完了させた。『漢篆千字文』は、約1万6千点の篆字画像(文字種は約千百文字)を切り出し、追加で作業した『偏類六書通』に関しては、約3万2千点の篆字画像(文字種は約5千5百文字)を切り出した。
|
Strategy for Future Research Activity |
次年度以降、ディープラーニング用の篆字画像データの切り出しを継続して行い、機械学習による篆字認識システムの精度を向上させるための検証を重ねる。同時に、画像データのタグ情報等の精査を行った上で、篆字データセットとして公開する。「蔵書印データベース」および「篆字部首検索システム(テキスト検索β版)」にデータの追増と改修を加え、より汎用性のある高度な検索システムの構築を行う。
|
Research Products
(3 results)