• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Historical Big Data: A Multidisicplinary Research Platform for Connecting Historical Sources and Data-Driven Models

Research Project

Project/Area Number 23H00510
Research Category

Grant-in-Aid for Scientific Research (A)

Allocation TypeSingle-year Grants
Section一般
Review Section Medium-sized Section 62:Applied informatics and related fields
Research InstitutionNational Institute of Informatics

Principal Investigator

北本 朝展  国立情報学研究所, コンテンツ科学研究系, 教授 (00300707)

Co-Investigator(Kenkyū-buntansha) 橋本 雄太  国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (10802712)
加納 靖之  東京大学, 地震研究所, 准教授 (30447940)
大邑 潤三  東京大学, 地震研究所, 助教 (40809381)
Project Period (FY) 2023-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2025)
Budget Amount *help
¥46,150,000 (Direct Cost: ¥35,500,000、Indirect Cost: ¥10,650,000)
Fiscal Year 2025: ¥14,430,000 (Direct Cost: ¥11,100,000、Indirect Cost: ¥3,330,000)
Fiscal Year 2024: ¥16,510,000 (Direct Cost: ¥12,700,000、Indirect Cost: ¥3,810,000)
Fiscal Year 2023: ¥15,210,000 (Direct Cost: ¥11,700,000、Indirect Cost: ¥3,510,000)
Keywords歴史ビッグデータ / データ構造化 / データ駆動型モデル / 分野横断 / 研究基盤 / 地理情報 / 歴史情報 / オープンサイエンス
Outline of Research at the Start

「歴史ビッグデータ」とは、現代のビッグデータ解析技術を過去の世界に延長し、過去の世界を新たな視点から探る研究である。人工知能(AI)やシミュレーションなど最新のデータ駆動型モデルを活用するには、くずし字で書かれた史料に残された記録をどう入力すればよいだろうか?
史料とデータ駆動型モデルを結合する鍵を握るのが、文書空間と実体空間を結合する「データ構造化」ワークフローである。そこで、文書のテキスト化やマークアップなど文書空間に関する技術と、地名エンティティなど実体空間に関する技術を研究し、分野横断的研究基盤に実装することで、歴史地震学や歴史気候学などの分野で歴史ビッグデータ研究を推進する。

Outline of Annual Research Achievements

歴史ビッグデータ研究をさらに発展させるため、データ・モデル・アプリの3つの面で成果を得た。
[1] 地名識別子については、『日本歴史地名大系』の行政地名オープンデータの精度向上を進め、各種アプリでの利用を拡大することで、歴史ビッグデータの分野横断型研究基盤の一つとして有効利用できるようにした。
[2] その他の識別子として、江戸時代の藩を対象とした「藩ID」を試作し、藩の同一性判定基準や代表表記選定基準などを専門家と議論して決定した。
[3] 文書空間と実体空間を接続するデータモデル「れきろく」については、安政江戸地震の被害状況を地理的に構造化する実証実験を行った。具体的には、「みんなで注釈」でアノテーションした構造化データを、地図に可視化するワークフローを構築した。
[4] 生成AIを活用したアプリについては、IIIF Tsukushi Viewerの公開や、歴史地震の震度推定システムの開発などの成果を上げた。IIIF Tsukushi Viewerは、AIくずし字認識「RURI」を用いたテキスト化の成果に基づき、日本古典籍とのAIチャット機能を実現した。一方、歴史地震の震度推定は、歴史地震学で標準的に用いられる数百個の震度判定ルールをプロンプトに入れることで、歴史資料のテキスト記述から震度という数値情報が得られるようになった。
[5] 研究コミュニティとの連携を進めるため、Linked Pasts 10国際会議を主催し、デジタルヒストリー分野におけるLinked Dataの活用について議論した。また、IIIF Curation Platformバージョン2のオープンソース公開を進めるなど、オープンソース・オープンデータの面でも研究成果を積極的に公開した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度の研究実施計画として想定していた項目はほぼ達成することができ、一部の項目については想定以上の成果を達成できた。

Strategy for Future Research Activity

本研究の大きな目標は「史料とデータ駆動型モデルの接続」にある。この目標を達成するために、最終年度は以下の課題に取り組む。
[1] 文書空間と実体空間を接続するデータモデル「れきろく」については、両空間における識別子の整備とGeoLODなどを用いたAPI化、さらには作業用のユーザインタフェースの構築を進めることで、実際のアプリにおける活用事例を増やす。
[2] 市区町村IDや藩IDなどの識別子を公開することで、識別子を活用したデータ構造化を複数のアプリで進める。また、他の研究プロジェクトでの活用を進める際の具体的課題についても研究を進める。
[3] 安政江戸地震などの歴史地震を対象として、AIを活用したデータ構造化に取り組むことで、より高解像度かつマルチモーダルな歴史データの構築を進める。
[4] 生成AIを活用したアプリについては、くずし字認識モデルRURIを中心にいくつかのOCRと連携することで、より多様な資料を読み込んでAIチャットが行えるようにシステムの拡張を進める。
[5] CODHセミナーを複数回開催することで、本プロジェクトの成果を公表するとともに、歴史ビッグデータに関する各種のデータやツールの使い方も研究コミュニティに広める。

Report

(3 results)
  • 2024 Annual Research Report
  • 2023 Comments on the Screening Results   Annual Research Report
  • Research Products

    (40 results)
  • Research Data

    (1 results)

All 2025 2024 2023 Other

All Journal Article (13 results) (of which Peer Reviewed: 8 results,  Open Access: 1 results) Presentation (21 results) (of which Int'l Joint Research: 4 results,  Invited: 9 results) Remarks (6 results)

  • [Journal Article] 地震史料のGISデータ化の意義と課題2025

    • Author(s)
      大邑潤三
    • Journal Title

      月刊地球

      Volume: 47 Pages: 184-194

    • Related Report
      2024 Annual Research Report
  • [Journal Article] 歴史ビッグデータ:歴史資料から機械可読データを構築するためのデータ構造化ワークフロー2024

    • Author(s)
      北本 朝展
    • Journal Title

      都市計画

      Volume: 73 Pages: 42-45

    • Related Report
      2024 Annual Research Report
  • [Journal Article] IIIF Tsukushi Viewer: 日本古典籍へのアクセス性を向上させる生成AIチャット機能2024

    • Author(s)
      北本 朝展, 本間 淳, カラーヌワット タリン
    • Journal Title

      情報処理学会技術報告

      Volume: 2024-CH-136 Pages: 1-8

    • Related Report
      2024 Annual Research Report
  • [Journal Article] A Machine Learning Approach to Identify Printing Blocks for Japanese Kokatsuji (Old Movable Type) Books2024

    • Author(s)
      Yuxiao Li, Asanobu KITAMOTO
    • Journal Title

      Digital Humanities 2024

      Volume: 1 Pages: 440-444

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed
  • [Journal Article] GeoLOD: A Toponym Platform to Connect Japanese Historical Gazetteers and Historical Big Data Apps2024

    • Author(s)
      Asanobu KITAMOTO, Yuta HASHIMOTO, Yasuyuki KANO, Junzo OMURA
    • Journal Title

      Digital Humanities 2024

      Volume: 1 Pages: 359-363

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Deep Learning for the Identification of Ex-libris Stamps (Zoshoin) in Old Japanese Books2024

    • Author(s)
      Irene Gentilini, Asanobu KITAMOTO
    • Journal Title

      Digital Humanities 2024

      Volume: 1 Pages: 205-207

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Beyond OCR: Enhancing Classical Japanese Transcription with Large Language Models"2024

    • Author(s)
      Tarin CLANUWAT, Tianyu Zhao, Yuki Imajuku, Asanobu KITAMOTO
    • Journal Title

      人文科学とコンピュータシンポジウム じんもんこん2024論文集

      Volume: 1 Pages: 75-82

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 歴史ビッグデータ構造化による安政江戸地震被害記録の分析2024

    • Author(s)
      北本 朝展, 橋本 雄太, 大邑 潤三, 加納 靖之
    • Journal Title

      人文科学とコンピュータシンポジウム じんもんこん2024論文集

      Volume: 1 Pages: 37-44

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed
  • [Journal Article] クラウドソーシングによる天保郷帳の全文翻刻と地理データセット化2024

    • Author(s)
      橋本 雄太, 大邑 潤三, 加納 靖之, 北本 朝展
    • Journal Title

      人文科学とコンピュータシンポジウム じんもんこん2024論文集

      Volume: 1 Pages: 261-266

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Minna de Honkoku: Citizen-Participation Transcription Project for Japanese Historical Documents2024

    • Author(s)
      Kano Yasuyuki, Hashimoto Yuta
    • Journal Title

      Annual Review of Earth and Planetary Sciences

      Volume: 53 Issue: 1 Pages: 1-18

    • DOI

      10.1146/annurev-earth-040523-120834

    • Related Report
      2024 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 地名の情報学と歴史地名データベース構想2023

    • Author(s)
      北本 朝展
    • Journal Title

      月刊「地理」

      Volume: 68 Pages: 48-55

    • Related Report
      2023 Annual Research Report
  • [Journal Article] そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有2023

    • Author(s)
      北本 朝展, 本間 淳, カラーヌワット タリン
    • Journal Title

      人文科学とコンピュータシンポジウム じんもんこん2023論文集

      Volume: 1 Pages: 51-58

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] みんなで翻刻ー歴史災害資料のシチズンサイエンス2023

    • Author(s)
      橋本雄太, 加納靖之
    • Journal Title

      科学

      Volume: 93 Pages: 926-929

    • Related Report
      2023 Annual Research Report
  • [Presentation] 文化財×AI:パラダイムシフトにどう向き合うか?2025

    • Author(s)
      北本 朝展
    • Organizer
      文化領域と最先端技術 第3回研究会
    • Related Report
      2024 Annual Research Report
    • Invited
  • [Presentation] 歴史的ベースレジストリ:時間軸を延伸した基盤データに向けて2025

    • Author(s)
      北本 朝展
    • Organizer
      地理空間情報に関するベースレジストリ利活用研究会 第12回
    • Related Report
      2024 Annual Research Report
    • Invited
  • [Presentation] 江戸全藩を対象とした藩IDの構築2024

    • Author(s)
      北本 朝展
    • Organizer
      デジタライジング研究会
    • Related Report
      2024 Annual Research Report
  • [Presentation] 華北交通アーカイブにおけるAIやデジタル技術の活用2024

    • Author(s)
      北本 朝展
    • Organizer
      シンポジウム「日本の写真遺産と芸術遺産の研究のための新デジタルツール」
    • Related Report
      2024 Annual Research Report
    • Invited
  • [Presentation] Linked Pasts Japan: A Japanese Community for Collaborating Linked Data and Historical & Heritage Studies2024

    • Author(s)
      Jun OGAWA, Tatsuki SEKINO, Yuta HASHIMOTO, Goki MIYAKITA, Natsuko YOSHIGA, Asanobu KITAMOTO
    • Organizer
      13th Conference of Japanese Association for Digital Humanities (JADH2024)
    • Related Report
      2024 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 日本文化と歴史ビッグデータ:過去と現在のギャップを縮めるAI2024

    • Author(s)
      北本 朝展
    • Organizer
      応用物理学会超集積エレクトロニクス産学連携委員会 第10回研究会
    • Related Report
      2024 Annual Research Report
    • Invited
  • [Presentation] 対話型生成AIを用いた歴史地震の震度判定の試み2024

    • Author(s)
      大邑 潤三, 北本 朝展, 加納 靖之, 橋本 雄太
    • Organizer
      日本地震学会2024年度秋季大会
    • Related Report
      2024 Annual Research Report
  • [Presentation] 江戸ビッグデータのオープン化:「れきちず」を活用した歴史的地理情報基盤に向けて2024

    • Author(s)
      北本 朝展, 加藤 創
    • Organizer
      FOSS4G 2024 Japan
    • Related Report
      2024 Annual Research Report
  • [Presentation] IIIF Curation Platform: Recent Developments to Support Large Language Models and the Latest APIs2024

    • Author(s)
      Asanobu KITAMOTO, Jun HOMMA
    • Organizer
      2024 IIIF Online Meeting
    • Related Report
      2024 Annual Research Report
    • Int'l Joint Research
  • [Presentation] IIIF Tsukushi Viewer:生成AIチャットがアシストする日本古典籍の新しい読み方2024

    • Author(s)
      北本 朝展
    • Organizer
      第27回DAショートトーク
    • Related Report
      2024 Annual Research Report
    • Invited
  • [Presentation] Japanese Toponym Platforms for the Past and the Present : GeoLOD, GeoNLP, Geoshape, Rekichime, and Rekichizu2024

    • Author(s)
      Asanobu KITAMOTO
    • Organizer
      Joint Symposium of Linked Pasts 10 and Linked Pasts Japan 1
    • Related Report
      2024 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Linked Pasts for Japan: A Vision for the Historical Big Data Platform and the Digital Humanities Consortium2024

    • Author(s)
      Asanobu KITAMOTO
    • Organizer
      Joint Symposium of Linked Pasts 10 and Linked Pasts Japan 1
    • Related Report
      2024 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 著作性のある資料とオープン・クローズ戦略:『日本歴史地名大系』や『れきちず』の事例2024

    • Author(s)
      北本 朝展
    • Organizer
      DHデータ構築検討会「著作権保護対象資料を活用したオープンデータ化の道筋を拓く」
    • Related Report
      2024 Annual Research Report
    • Invited
  • [Presentation] 『新収日本地震史料』の編纂時資料のデジタル化2024

    • Author(s)
      加納靖之, 大邑潤三
    • Organizer
      第41回歴史地震研究会
    • Related Report
      2024 Annual Research Report
  • [Presentation] クラウドソーシングとAI文字認識を駆使した 「くずし字」資料の大規模テキスト化2024

    • Author(s)
      橋本雄太
    • Organizer
      第19回言語処理学会若手の会(YANS2024)
    • Related Report
      2024 Annual Research Report
  • [Presentation] 武鑑全集:空間的・時間的な構造化データを構築する効率的なワークフローの探求と江戸長期時系列データの構築2024

    • Author(s)
      北本 朝展
    • Organizer
      デジタライジング研究会
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 出版社との協働による『日本歴史地名大系』の一部オープンデータ化と『歴史的行政区域データセット』との統合2023

    • Author(s)
      北本 朝展
    • Organizer
      第22回歴史ビッグデータ研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 歴史的行政区域データセットの拡大と歴史ビッグデータ研究への活用2023

    • Author(s)
      北本 朝展, 村田 健史
    • Organizer
      日本地球惑星科学連合(JpGU)2023年大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] GeoとNLPをつなぐ地名の情報学2023

    • Author(s)
      北本 朝展
    • Organizer
      地理空間情報と自然言語処理勉強会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 歴史ビッグデータにおける時空間データの利活用2023

    • Author(s)
      北本 朝展
    • Organizer
      第3回人間文化研究機構DH研究会「DHデータ基盤としてのデータセット~利用と提供から考える」
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 歴史地理データから考える人文学DXの未来像2023

    • Author(s)
      北本 朝展
    • Organizer
      国際シンポジウム:デジタル・ヒューマニティーズと研究基盤
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Remarks] 『日本歴史地名大系』地名項目データセット

    • URL

      https://geoshape.ex.nii.ac.jp/nrct/

    • Related Report
      2024 Annual Research Report 2023 Annual Research Report
  • [Remarks] 歴史的行政区域データセットβ版

    • URL

      https://geoshape.ex.nii.ac.jp/city/

    • Related Report
      2024 Annual Research Report 2023 Annual Research Report
  • [Remarks] 武鑑全集

    • URL

      http://codh.rois.ac.jp/bukan/

    • Related Report
      2024 Annual Research Report 2023 Annual Research Report
  • [Remarks] edomi

    • URL

      http://codh.rois.ac.jp/edomi/

    • Related Report
      2024 Annual Research Report 2023 Annual Research Report
  • [Remarks] 江戸期地理データセット

    • URL

      https://geoshape.ex.nii.ac.jp/edo/

    • Related Report
      2024 Annual Research Report
  • [Remarks] みんなで注釈

    • URL

      https://ansei2.vercel.app/

    • Related Report
      2023 Annual Research Report

All 2026

  • 「江戸切絵図」町家領域データセット2026

    • Funder
      • Funder Name
        Japan Society For The Promotion Of Science
      • e-Rad_funder
        1025
      • Identifier of Crossref Funder Registry

        https://doi.org/10.13039/501100001691

      • Japan Grant Number
        JP23H00510
      • Project Name
        歴史ビッグデータ:史料とデータ駆動型モデルを結合する分野横断型研究基盤の構築
    • Title
      「江戸切絵図」町家領域データセット
    • Issued Date
      2026-04-06
    • Abstract
      「江戸切絵図」町家領域データセットは、江戸切絵図から抽出した町家領域のデータセットです。
    • Research Field
      人文・社会
    • Data Type
      geospatial data
    • Data Utilization and Provision Policy
      CC BYライセンスで公開
    • Access Rights Type
      open access
    • Repository Information
      ROIS-DS人文学オープンデータ共同利用センター
    • URI

      https://codh.rois.ac.jp/edo-maps/rekichizu/

    • DOI

      10.20676/00000446

    • Contributor
      • Contributor Type
        Data Manager
      • Contributor Name
        ROIS-DS人文学オープンデータ共同利用センター
      • Contributor Type
        Hosting Institution
      • Contributor Name
        ROIS-DS人文学オープンデータ共同利用センター
      • Contributor Type
        Contact Of Data Manager
      • Contributor Name
        kitamoto*nii.ac.jp (メールアドレスは「@」を「*」に置換しています。)
    • Data No.

      JP23H00510-2024-0001

    • Related Report
      2024 Annual Research Report

URL: 

Published: 2023-04-13   Modified: 2026-04-14  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi