2021 Fiscal Year Annual Research Report
A Study of Contextual Data Packaging for Humanities
Project/Area Number |
20H00010
|
Research Institution | The University of Tokyo |
Principal Investigator |
山家 浩樹 東京大学, 史料編纂所, 教授 (60191467)
|
Co-Investigator(Kenkyū-buntansha) |
本郷 恵子 東京大学, 史料編纂所, 教授 (00195637)
尾上 陽介 東京大学, 史料編纂所, 教授 (00242157)
阿児 雄之 独立行政法人国立文化財機構東京国立博物館, 学芸企画部, 主任研究員 (00401555)
林 晃弘 東京大学, 史料編纂所, 助教 (10719272)
井上 聡 東京大学, 史料編纂所, 准教授 (20302656)
小瀬 玄士 東京大学, 史料編纂所, 助教 (30634026)
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 室長 (70332195)
山田 太造 東京大学, 史料編纂所, 准教授 (70413937)
渋谷 綾子 東京大学, 史料編纂所, 特任助教 (80593657)
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 古文書 / 古記録 / 人文科学研究資源 / データパッケージ化 / 木簡 / ガラス原板 |
Outline of Annual Research Achievements |
2020年度までの成果にもとづき、以下に示す3課題を実施した。 1.多様かつ大量なデータの統合と永続的な提供を可能にする環境整備:史料編纂所における基幹である所蔵史料目録DB(Hi-CAT)と史資料の物理的データ(紙質・状態・修理履歴など)を集約する「史料情報統合管理システム」との連携を引き続き進めた。大量のデータを管理・共有していくため、新規にストレージを導入した。さらにデスクトップ上で顕微鏡画像へアノテーションを簡易に付与し管理できるアプリケーション「caid」を史料情報統合管理システムへアップロードできるなど出力方式の確立と実装を進めた。 2. データのパッケージ化と提示手法の確立:1.の成果をもとに、史料に関わるさまざまなデータの収集していくコンテキストに基づいたパッケージ化方式の確立につとめた。この結果に対して、LDAやCNNといったAI・機械学習手法の適用を進めることでデータ駆動型データ提示モデルの検証を進めるため、史料データの分類や可視化の手法を取り入れたシステムのプロトタイピングを進めた。 3. 紙史資料以外の人文科学研究資源への適用可能性の分析・検証:紙史資料を主対象とした1.および2.の手法を、奈良文化財研究所が行っている出土木簡を対象とする取り組みとの比較検証を進め、プロトタイピングを進めた。また、東京国立博物館蔵ガラス原板をもとにした史料画像の利活用を前提とした適用手法についても検証を進めた。継続して、1.における史料情報統合管理システムへのフィードバックについても検証を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
年度当初にあげた計画の実施では、昨年度に引き続き、caidのプロトタイピングとその実践、多様かつ大量なデータを利活用するための新規ストレージ導入、出土木簡への適用を行うなど、データパッケージ化の確立をすすめることができた。また、適用範囲の検証・拡大を図る上で、東京国立博物館蔵のガラス原板を対象とした検討を進めることができたことは大きな成果であると考えている。以上より「おおむね順調」として判断した。
|
Strategy for Future Research Activity |
デスクトップ上で顕微鏡画像へアノテーションを簡易に付与し管理できるアプリケーション「caid」は本研究の進展において非常に重要であることから、2021年度までの成果をフィードバックさせ、利便性の向上や共有方式の確立をすすめるなど、成長・進化させていく。そこで、caidに蓄積してきたデータを共有し、永続的に管理するためのサーバ「caid server」を構築し、さらに史料情報統合管理システムとのシステム連携の方式を確立していく。 引き続き、コンテキストに基づいた史料データのパッケージ化を進めていく。データ駆動型データ提示モデルを検証し、史料データの分類や可視化の手法を確立・実装すべくプロトタイピングを行っていく。 紙史資料以外の人文科学研究資源への適用可能性の分析・検証のため、奈良文化財研究所による出土木簡、東京国立博物館によるガラス原板の各種データを対象として取り組むための検証を続ける。 上記の成果を、史料情報統合管理システムとの連携を進めていくことで、史資料にかかわるデータを簡易に作成・収集しえる仕組みを追究していく。
|
Research Products
(45 results)