2021 Fiscal Year Annual Research Report
Creation of Humanities research infrastructure by generation of integrated historical material image data and establishment of its driven method
Project/Area Number |
18H03576
|
Research Institution | The University of Tokyo |
Principal Investigator |
山田 太造 東京大学, 史料編纂所, 准教授 (70413937)
|
Co-Investigator(Kenkyū-buntansha) |
本郷 恵子 東京大学, 史料編纂所, 教授 (00195637)
尾上 陽介 東京大学, 史料編纂所, 教授 (00242157)
金子 拓 東京大学, 史料編纂所, 准教授 (10302655)
井上 聡 東京大学, 史料編纂所, 准教授 (20302656)
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
山家 浩樹 東京大学, 史料編纂所, 教授 (60191467)
久留島 典子 神奈川大学, 国際日本学部, 教授 (70143534)
馬場 基 独立行政法人国立文化財機構奈良文化財研究所, 都城発掘調査部, 室長 (70332195)
伴瀬 明美 大阪大学, 大学院人文学研究科(人文学専攻、芸術学専攻、日本学専攻), 准教授 (90292797)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (90415612)
後藤 真 国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 史資料画像 / IIIF / データ駆動 / キュレーション / 機械学習 |
Outline of Annual Research Achievements |
2020年度までの成果にもとづき,統合史資料画像データ駆動型人文科学研究基盤の確立を進めて行くため,以下に示す3課題を実施した. 1.統合史資料画像データ生成手法の確立: 引き続き,統合史資料画像データの構造化の洗練と生成方法の確立を進めた.今年度は次の2点を重点的に実施した.1-1. くずし字等の文字画像データ: JSPS科研費18H05221との連携により2020年度本運用を開始した「史的文字データベース連携検索システム」において,文字データ共通基盤を洗練していくため,文字データの時間的・空間的特徴を整理し,その結果の可視化手法を検証した.1-2.史資料画像とそれに紐づくデータの統合:引き続き,宮崎県下を中心とした史資料の調査・撮影を行った.これまでの調査結果として,2021年7月には,JSPS科研費18H00698とともに,都城島津邸との連携により,『都城島津邸所蔵史料』の画像約11,000点を史料編纂所データベース検索サービスSHIPS DBにおけるHi-CAT Plusより公開した.また『上井覚兼日記』に関わる史資料とその画像,登場する人名・地名を関連付けも引き続き行った. 2.統合史資料画像データ管理システムの構築: 統合史資料画像データを格納・管理し,検索・提示していくための基盤整備を引き続き進めた.その成果として,1-2の史資料画像公開にあわせ,これまでプロトタイピングを進めていた,画像ビューアを含む史資料画像提示システムの公開を行った. 3.潜在的関連史資料の検出:史料編纂所で構築している歴史情報リポジトリ(人名・地名・文字をその出典とともに蓄積)の拡充のため,『後愚昧記』の人名索引データ作成を行った .また,鎌倉時代の記録である『民経記』を用いて,人名等の固有表現抽出手法を検証す るなど,潜在的関連史資料の検出手法および可視化手法の確立を進めた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
史的文字データベース連携検索システムにおける文字データの検証を進めることができた.これまで都城島津邸での史資料調査結果を踏まえ,『都城島津邸所蔵史料』をWeb公開できたことは大きな進展だと考えられる.また,SHIPS DBにおけるHi-CAT Plusにて,画像ビューアを含め,画像・目録・史料群を関連付けた史資料画像提示システムとしてリリースできたことは大きな進展を含む成果だと考えている.人名・地名と史資料画像の関連付けを進める上で,『民経記』を対象とした固有表現抽出の試みをすすめることができた. 以上よりおおむね順調に進展していると判断した.
|
Strategy for Future Research Activity |
統合史資料画像データ生成手法の確立,IIIF Presentation API等を利用した統合史資料画像データ管理システムの構築は,引き続き,これまでの成果をフィードバックしながら確立 していく.特に,目録・画像・本文・文字など大量かつ多様な人文科学データそれぞれを永 続的に扱うための方法についても検討していく.2022年度に公開する新SHIPS DBへの適用を行うことで本研究の成果の実用化に向けて取り組む.また,新たな史資料への適用やこれまでとは異なる機械学習手法への適用などを踏まえ,本研究手法の適用範囲を拡大していく.最終的には本研究の総括を行う.
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] "Toward a Structured Description of the Footnotes of the Taisho Tripitaka"2021
Author(s)
Yoichiro Watanabe, Kiyonori Nagasaki, Hyunjin Park, Yif?n W?ng, Tomohiro Murase, Masayoshi Watanabe, Norimichi Yajima, Yoshihiro Sato, Y?i Sakuma, Xinxing Yu, Shumpei Katakura, Masahiro Shimoda, Ikki Ohmukai,
Organizer
TEI Conference and Members' Meeting 2021, Virtual Conference
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-