2019 Fiscal Year Annual Research Report
Creation of Humanities research infrastructure by generation of integrated historical material image data and establishment of its driven method
Project/Area Number |
18H03576
|
Research Institution | The University of Tokyo |
Principal Investigator |
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
Co-Investigator(Kenkyū-buntansha) |
本郷 恵子 東京大学, 史料編纂所, 教授 (00195637)
尾上 陽介 東京大学, 史料編纂所, 教授 (00242157)
金子 拓 東京大学, 史料編纂所, 准教授 (10302655)
井上 聡 東京大学, 史料編纂所, 准教授 (20302656)
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
山家 浩樹 東京大学, 史料編纂所, 教授 (60191467)
久留島 典子 東京大学, 史料編纂所, 教授 (70143534)
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 室長 (70332195)
伴瀬 明美 東京大学, 史料編纂所, 准教授 (90292797)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (90415612)
後藤 真 国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 史資料画像 / IIIF / データ駆動 / キュレーション / 機械学習 |
Outline of Annual Research Achievements |
本研究では史資料における多様な史資料データをアーカイブされた史資料画像を中核に据えて構造化していく統合史資料画像データの生成に向けて,おもに以下の3つの課題を解決していく. 1.統合史資料画像データ生成手法の確立:汎用かつ有用な史資料画像データ統合基盤を確立するため,以下の2つに取り組んだ. a.文字画像データ:東京大学史料編纂所「電子くずし字字典DB」および奈良文化財研究所「木簡庫」との連携検索システムを拡張し,他機関の文字データベースの参入を可能にしつつ,文字画像データを中心とした新たな連携検索システム「史的文字データベース連携検索システム」について,JSPS科研費(18H05221)との共同により実証試験版を公開した. b.古文書・古記録等の文献資料画像:『上井覚兼日記』および天正・慶長期の島津家に関連する史資料について宮崎県都城島津邸等都城市周辺,さらには熊本県人吉市付近にまで拡張し実施した. 2.統合史資料画像データ管理システムの構築:昨年度までに開発を進めたIIIF Presentation APIを利用できる画像ビューアの利用範囲を広げ,JSPS科研費(17H06117)との共同により,史料編纂所以外の所蔵史料に関する画像データベースであるHi-CAT Plusへの適用を行った.さらにIIIF Presentation APIのmanifestを活用すべく改良の検討を進めた. 3.潜在的関連史資料の検出:昨年度までの成果をベースとし,日本史史料の収集・蓄積・分析・提示といったフェーズを検討し,特に,これまでに進めたLatent Dirichlet Allocation(LDA)に代表されるトピックモデルの適用のための条件,データ変換,検索への適用といったデータ駆動型の日本史データフローについて検討し予備実験を開始した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
IIIF Presentation APIの利用においては特に画像データの利用条件設定が必須であり,Hi-CAT Plusは史料編纂所外の所蔵史料を扱うため所蔵者への権利関係処理が課題だったが,JSPS科研費(17H06117)によりデータ利用権限設定を進められたことによりIIIF Presentation API適用が可能になった.JSPS人文学・社会科学データインフラストラクチャー事業において史料編纂所がこの人文学拠点に選定されたことにより,「3.潜在的関連史資料の検出」においてデータフロー確立という新たな方向性を示すことができた.この成果は情報処理学会人文科学とコンピュータシンポジウム「じんもんこん2019」においていち早く報告することができた.以上よりおおむね順調に進展していると判断した.
|
Strategy for Future Research Activity |
これまでの取り組みを踏まえ,さらに文字画像データの統合検索を含む統合史資料画像データ生成手法の確立,IIIF Presentation API等を利用した統合史資料画像データ管理システムの構築について推し進めていく.さらに日本史データフローの確立を,潜在的関連史資料の検出の成果のもとに進め,一層実用化に向けて取り組む.
|
Research Products
(103 results)