2018 Fiscal Year Annual Research Report
Creation of Humanities research infrastructure by generation of integrated historical material image data and establishment of its driven method
Project/Area Number |
18H03576
|
Research Institution | The University of Tokyo |
Principal Investigator |
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
Co-Investigator(Kenkyū-buntansha) |
本郷 恵子 東京大学, 史料編纂所, 教授 (00195637)
尾上 陽介 東京大学, 史料編纂所, 教授 (00242157)
金子 拓 東京大学, 史料編纂所, 准教授 (10302655)
井上 聡 東京大学, 史料編纂所, 助教 (20302656)
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
山家 浩樹 東京大学, 史料編纂所, 教授 (60191467)
久留島 典子 東京大学, 史料編纂所, 教授 (70143534)
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 室長 (70332195)
伴瀬 明美 東京大学, 史料編纂所, 准教授 (90292797)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (90415612)
後藤 真 国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 史資料画像 / IIIF / データ駆動 / キュレーション / 機械学習 |
Outline of Annual Research Achievements |
本研究では史資料における多様な史資料データをアーカイブされた史資料画像を中核に据えて構造化していく統合史資料画像データの生成に向けて,おもに以下の3つの課題を解決していく. 1.統合史資料画像データ生成手法の確立:汎用かつ有用な史資料画像データ統合基盤を確立するため,以下の2つに取り組んだ. a.文字画像データ:東京大学史料編纂所(以下史料編纂所)歴史情報処理システムにおけるデータベースSHIPS DB「電子くずし字字典DB」および奈良文化財研究所「木簡庫」との連携検索システムを拡張し,他機関の文字データベースの参入を可能にしつつ,文字画像データを中心とした新たな連携検索システムのシステム基盤を,JSPS科研費(18H05221)との共同により,検討した. b.古文書・古記録等の文献資料画像:『上井覚兼日記』および天正・慶長期の島津家に関連する史資料について宮崎県都城島津邸および宮崎県総合博物館所蔵の史資料を中心に行った. 2.統合史資料画像データ管理システムの構築:史料編纂所前近代日本史情報国際センターとの共同により,史料編纂所における画像データに対し利用条件設定を行い,SHIPS DB「所蔵史料目録DB」に対し,IIIF Presentation APIを設置し,新たにmiradorと呼ばれるIIIF Presentation APIを利用できる画像ビューアを導入した.また史料編纂所が編纂・出版した史料集の版面画像ギャラリーである「史料集版面ギャラリー」を公開した. 3.潜在的関連史資料の検出:1および2の成果に基づき,Latent Dirichlet Allocation(LDA)に代表されるトピックモデルの適用を検討し予備実験を開始した.その上で『上井覚兼日記』における本文データ構造の再構成を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
IIIF Presentation APIの利用においては特に画像データの利用条件設定が必須である.史料編纂所における画像データに対して利用条件設定を行うことができた.この利用実例として,「所蔵史料目録DB」におけるIIIF Presentation APIの設置および「史料集版面ギャラリー」の公開が挙げられる.また,文字画像データの連携検索システム基盤の整理を推し進めることができ,来年度以降の新連携検索システムの実現が可能になった.以上よりおおむね順調に進展していると判断した.
|
Strategy for Future Research Activity |
これまでの取り組みを踏まえ,文字画像データや古記録データ等を対象とした統合史資料画像データ生成手法の確立,IIIF Presentation API等を利用した統合史資料画像データ管理システムの構築,それらの成果に基づく潜在的関連史資料の検出を推し進め,実用化に向けて取り組む.
|