Project/Area Number |
20H00010
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 2:Literature, linguistics, and related fields
|
Research Institution | The University of Tokyo |
Principal Investigator |
山家 浩樹 東京大学, 史料編纂所, 教授 (60191467)
|
Co-Investigator(Kenkyū-buntansha) |
本郷 恵子 東京大学, 史料編纂所, 教授 (00195637)
尾上 陽介 東京大学, 史料編纂所, 教授 (00242157)
林 晃弘 東京大学, 史料編纂所, 准教授 (10719272)
井上 聡 東京大学, 史料編纂所, 准教授 (20302656)
小瀬 玄士 東京大学, 史料編纂所, 助教 (30634026)
山田 太造 東京大学, 史料編纂所, 准教授 (70413937)
渋谷 綾子 東京大学, 史料編纂所, 特任助教 (80593657)
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
阿児 雄之 独立行政法人国立文化財機構東京国立博物館, 学芸企画部, 室長 (00401555)
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, センター長 (70332195)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥44,200,000 (Direct Cost: ¥34,000,000、Indirect Cost: ¥10,200,000)
Fiscal Year 2024: ¥6,630,000 (Direct Cost: ¥5,100,000、Indirect Cost: ¥1,530,000)
Fiscal Year 2023: ¥6,630,000 (Direct Cost: ¥5,100,000、Indirect Cost: ¥1,530,000)
Fiscal Year 2022: ¥8,710,000 (Direct Cost: ¥6,700,000、Indirect Cost: ¥2,010,000)
Fiscal Year 2021: ¥14,820,000 (Direct Cost: ¥11,400,000、Indirect Cost: ¥3,420,000)
Fiscal Year 2020: ¥7,410,000 (Direct Cost: ¥5,700,000、Indirect Cost: ¥1,710,000)
|
Keywords | 古文書 / 古記録 / 人文科学研究資源 / データパッケージ化 / 木簡 / ガラス原板 |
Outline of Research at the Start |
本研究は、基礎的資源としての史資料に関する各種・多様なデータについて、統合的に利用しうる環境を構築することを目指す。目録・画像・テキスト・人名・地名・修補記録・伝来情報などの諸データは、これまで逐次的にそれぞれ独立して作成されてきた。こうした多様なデータを永続的に統合運用しうる環境を整備するため、人文科学データのパッケージ化手法を確立し、それを体現する情報システムの設計・開発を実践する。また古文書・古記録といった紙資料だけでなく、木簡や絵画など他資料への適用可能性についても検討を深めてゆく。こうした取り組みによって、人文科学研究資源のデータストアのあり方を一新するような研究の展開を目指す。
|
Outline of Annual Research Achievements |
2021年度までの成果にもとづき,以下に示す3課題を実施した。 1.多様かつ大量なデータの統合と永続的な提供を可能にする環境整備:史料編纂所における基幹である所蔵史料目録DB(Hi-CAT)と史資料の物理的データ(紙質・状態・修理履歴など)を集約する「史料情報統合管理システム」との連携方式を確立していくため、昨年度までに開発を進めた「caid」に蓄積してきたデータを共有し永続的に管理するためのサーバ「caid server」をプロトタイピングした。
2. データのパッケージ化と提示手法の確立:引き続き、1.の成果をもとに、史料に関わるさまざまなデータの収集していくコンテキストに基づいたパッケージ化方式の確立につとめた。この結果に対して、史料データの分類や可視化の手法を確立していくため、トピックモデルLDA・STMといったAI・機械学習手法の適用を進めることでデータ駆動型データ提示モデルの検証を進めた。
3. 紙史資料以外の人文科学研究資源への適用可能性の分析・検証:これまでに引き続き、奈良文化財研究所が行っている出土木簡や東京国立博物館蔵ガラス原板をもとにした史料画像の利活用を前提とした適用手法についても検証を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度までに開発してきたcaidに蓄積している史資料の顕微鏡画像ならびにアノテーションを永続的に共有・管理するため、caid serverのプロトタイピングを行った。これは史資料に関わるデータのうち、調査というコンテキストを集約し、人文知として蓄積していく「人文知」クラウドとも称することのできる機能であり、AI・機械学習による史資料の分類をも可能にしていくことで「総合知」としての研究成果の蓄積をも視野に入れた研究モデルとして位置づけられる。これまでに蓄積してきた史資料データとその分析結果については、JSPS科研費19H00549などと連携し、研究座談会「料紙研究を語る」(2022/9/6)公開研究会「茂木文書と科学の出会い」(2023/3/5)にて報告がなされた。また東京国立博物館蔵のガラス原板などモノ史資料を対象とした検討も引き続き進めることができた。 以上より「おおむね順調」として判断した。
|
Strategy for Future Research Activity |
以下に示す3課題を実施していく。 1.多様かつ大量なデータの統合と永続的な提供を可能にする環境整備:史資料料紙に対するキュレーションを可能にするアプリケーション「caid」におけるデータを対象に、集約し永続的管理を実現する「caid server」を昨年度までにプロトタイピングした。この実証的検証を進めるさらに史料編纂所所蔵史料目録DB(Hi-CAT)と史資料の物理的データ(紙質・状態・修理履歴など)を集約する「史料情報統合管理システム」との連携を引き続き進め、蓄積されたデータ公開手法の検討を行う。
2. データのパッケージ化と提示手法の確立:引き続き1.の成果をもとに、コンテキストに基づいた史料データのパッケージ化を進め、その可視化においてデータ駆動型データ提示モデルの検証を経て、その有効性を図る。
3. 紙史資料以外の人文科学研究資源への適用可能性の分析・検証:引き続き、1.および2.の手法を、奈良文化財研究所による出土木簡、東京国立博物館によるガラス原板の各種データを対象として取り組む。昨年度までの成果をもとに、1.における史料情報統合管理システムへのフィードバックについても検証していく。
|