| Project/Area Number |
21H04356
|
| Research Category |
Grant-in-Aid for Scientific Research (A)
|
| Allocation Type | Single-year Grants |
| Section | 一般 |
| Review Section |
Medium-sized Section 3:History, archaeology, museology, and related fields
|
| Research Institution | The University of Tokyo |
Principal Investigator |
西田 友広 東京大学, 史料編纂所, 准教授 (90376640)
|
| Co-Investigator(Kenkyū-buntansha) |
井上 聡 東京大学, 史料編纂所, 准教授 (20302656)
堀川 康史 東京大学, 大学院情報学環・学際情報学府, 准教授 (80760280)
山田 太造 東京大学, 史料編纂所, 准教授 (70413937)
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
貫井 裕恵 神奈川県立金沢文庫, 学芸課, 学芸員 (40782868)
三輪 眞嗣 神奈川県立金沢文庫, 学芸課, 学芸員 (30829297)
高橋 悠介 慶應義塾大学, 斯道文庫(三田), 教授 (40551502)
佐藤 雄基 立教大学, 文学部, 教授 (00726573)
守田 逸人 香川大学, 教育学部, 教授 (10434250)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (90415612)
深川 大路 同志社大学, 文化情報学部, 准教授 (10442518)
|
| Project Period (FY) |
2021-04-05 – 2026-03-31
|
| Project Status |
Granted (Fiscal Year 2025)
|
| Budget Amount *help |
¥40,690,000 (Direct Cost: ¥31,300,000、Indirect Cost: ¥9,390,000)
Fiscal Year 2025: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2024: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2023: ¥6,630,000 (Direct Cost: ¥5,100,000、Indirect Cost: ¥1,530,000)
Fiscal Year 2022: ¥14,820,000 (Direct Cost: ¥11,400,000、Indirect Cost: ¥3,420,000)
Fiscal Year 2021: ¥10,010,000 (Direct Cost: ¥7,700,000、Indirect Cost: ¥2,310,000)
|
| Keywords | 中世史料学 / 断簡 / 墨映文書 / 逸失史料 / データベース連携 / 古文書学 / 墨映 / レポジトリ / システム連携 |
| Outline of Research at the Start |
日本中世史学は、徹底的な史料批判を実践することで、歴史像の厳密な再構成につとめてきた。しかしながら厳密性を追究した結果、分析対象から漏れてしまう史料も生み出してしまった。それらは断簡・無年号文書・破損汚損文書といった、史料批判の構成要件を満たせなかったものである。本研究は、隣接諸科学を含めたあらゆる方法論を援用し、かつ情報化されたデータをあまねく参照できる環境を整えることで、こうした史料の可能性を徹底的に追究し、有効な研究資源とすることを目指している。併せて、かつて確かに存在していた文書の痕跡を伝来史料から丹念に抽出することで、現存史料の背景に広がる、浩瀚な史料世界の復元に取り組んでゆく。
|
| Outline of Annual Research Achievements |
前年度の成果を踏まえて、計画調書に記した4つのテーマから研究を推進した。 ①断片化した史料を対象とする調査情報の高度化研究では、「翻刻支援システム」を用いて、史料の体裁情報・テキスト情報を生成するとともに、前年度までに整えた規範に則り構造化を具現化した。あわせて生成データについては、「史料情報統合管理システム」をはじめとする史料編纂所歴史情報処理システム(SHIPS)データベース群へと展開し、汎用的に運用しうる環境整備に努めた。 ②蓄積された知識情報の参照によるテキスト解析の高度化研究においては、前年度より継続してSHIPS-DB群から人名・地名などの歴史知識情報を抽出・蓄積する作業にとりくんだ。さらに史料集版面にOCRを施しテキスト化を進め、これに機械による固有表現抽出を実行することで、人名・地名情報の増強を図った。こうした情報の豊富化・多様化によってAIを用いた文脈解析の精度向上を進めることができた。 ③中世逸失史料情報の復元研究では、前年度に続き『鎌倉遺文』『南北朝遺文』を対象として、史料テキスト上に出現する逸失史料につき、その検出・データ蓄積を推進した。これまでに「鎌倉遺文」からは約1万5千件余、「南北朝遺文」からは約4千5百件弱のデータ収集を実現し、総体として2万件の逸失史料を検出することに成功している。また、こうしたデータをSHIPS-DBにて有効に利活用するための、公開手法について検討を重ねた。 ④課題解決にむけた分業体制の確立と拠点機関間の連携研究では、継続して神奈川県立金沢文庫国宝金沢文庫文書データベースの収載コンテンツを強化するとともに(約400件追加)、SHIPS内のユニオンカタログDBとの連携を実践した。平行して①から③の研究成果を同文庫データベース上においても活用しうるよう、システム連携の強化を図ったところである。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
テキスト構造化の標準化を図るとともに、これを「翻刻支援システム」へと反映させることで、テキスト情報および関連メタ情報の豊富化・多様化を実現しつつある。逸失史料の収集も、当年度3千件以上の新たな検出・登録を達成しており、これらを本格的に利活用環境に投入すべき段階を迎えている。機関間システムの連携についても、金沢文庫と史料編纂所の連携強化が進んでおり、テキスト情報・メタ情報の共有のみならず、より広汎な機能連携を展望しうる状況が到来している。
|
| Strategy for Future Research Activity |
「翻刻支援システム」の高度化と具体的データの蓄積を踏まえて、史料情報の高度化・構造化・汎用化がさらに進むなかで、機械学習を援用した大規模な史料的脈絡の析出という課題に正面から向き合うべき段階が到来しつつある。さまざまな手法を通じて人名・地名・歴史的語彙に関する諸情報が集約されてゆくとともに、多くの逸失史料の検出が進むことで、断片的な史料群の存在意義が高まり、豊かな歴史像復元の大きな手がかりとなりつつある。史料を扱う機関間の本質的連携が一層進めば、更なる高みに登ることが可能になるだろう。こうした観点から、より合理的な方法論を模索し、研究分担者のみならず、より広い連携・共有を目指してゆくことが俟たれている。
|