2014 年度研究成果報告書

ＸＭＬによる初期刊本の本文記述の方法論の確立と印刷史研究への応用

研究課題

研究課題/領域番号	20700225
研究種目	若手研究(B)
配分区分	補助金
研究分野	図書館情報学・人文社会情報学
研究機関	慶應義塾大学
研究代表者	安形麻理慶應義塾大学, 文学部, 准教授 (70433729)
研究期間 (年度)	2008-04-01 – 2015-03-31
キーワード	書誌学 / 印刷史 / トランスクリプション / グーテンベルク聖書 / 初期刊本 / デジタル画像
研究成果の概要	初期刊本の画像データを用いた活字の識別の正確かつ効率的な手法を開発した。この手法により、一般のOCRソフトでは処理できない典型的な初期刊本についても、大規模なテキストデータ化が可能になると期待される。次に、西洋最初の印刷本であるグーテンベルク聖書の画像を対象に本活字識別手法を応用した。識別結果に基づき、活字を客観的な基準で分析するため、活字画像のクラスタリングを行い、活字の鋳造方法についての先行研究を検証した。また、識別結果に基づきトランスクリプションデータを作成し、XMLによる本文記述を行った。
自由記述の分野	書誌学