• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

歴史ビッグデータ:史料とデータ駆動型モデルを結合する分野横断型研究基盤の構築

研究課題

研究課題/領域番号 23H00510
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
審査区分 中区分62:応用情報学およびその関連分野
研究機関国立情報学研究所

研究代表者

北本 朝展  国立情報学研究所, コンテンツ科学研究系, 教授 (00300707)

研究分担者 橋本 雄太  国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (10802712)
加納 靖之  東京大学, 地震研究所, 准教授 (30447940)
大邑 潤三  東京大学, 地震研究所, 助教 (40809381)
研究期間 (年度) 2023-04-01 – 2026-03-31
研究課題ステータス 交付 (2025年度)
配分額 *注記
46,150千円 (直接経費: 35,500千円、間接経費: 10,650千円)
2025年度: 14,430千円 (直接経費: 11,100千円、間接経費: 3,330千円)
2024年度: 16,510千円 (直接経費: 12,700千円、間接経費: 3,810千円)
2023年度: 15,210千円 (直接経費: 11,700千円、間接経費: 3,510千円)
キーワード歴史ビッグデータ / データ構造化 / データ駆動型モデル / 分野横断 / 研究基盤 / 地理情報 / 歴史情報 / オープンサイエンス
研究開始時の研究の概要

「歴史ビッグデータ」とは、現代のビッグデータ解析技術を過去の世界に延長し、過去の世界を新たな視点から探る研究である。人工知能(AI)やシミュレーションなど最新のデータ駆動型モデルを活用するには、くずし字で書かれた史料に残された記録をどう入力すればよいだろうか?
史料とデータ駆動型モデルを結合する鍵を握るのが、文書空間と実体空間を結合する「データ構造化」ワークフローである。そこで、文書のテキスト化やマークアップなど文書空間に関する技術と、地名エンティティなど実体空間に関する技術を研究し、分野横断的研究基盤に実装することで、歴史地震学や歴史気候学などの分野で歴史ビッグデータ研究を推進する。

研究実績の概要

歴史ビッグデータ研究をさらに発展させるため、データ・モデル・アプリの3つの面で成果を得た。
[1] 地名識別子については、『日本歴史地名大系』の行政地名オープンデータの精度向上を進め、各種アプリでの利用を拡大することで、歴史ビッグデータの分野横断型研究基盤の一つとして有効利用できるようにした。
[2] その他の識別子として、江戸時代の藩を対象とした「藩ID」を試作し、藩の同一性判定基準や代表表記選定基準などを専門家と議論して決定した。
[3] 文書空間と実体空間を接続するデータモデル「れきろく」については、安政江戸地震の被害状況を地理的に構造化する実証実験を行った。具体的には、「みんなで注釈」でアノテーションした構造化データを、地図に可視化するワークフローを構築した。
[4] 生成AIを活用したアプリについては、IIIF Tsukushi Viewerの公開や、歴史地震の震度推定システムの開発などの成果を上げた。IIIF Tsukushi Viewerは、AIくずし字認識「RURI」を用いたテキスト化の成果に基づき、日本古典籍とのAIチャット機能を実現した。一方、歴史地震の震度推定は、歴史地震学で標準的に用いられる数百個の震度判定ルールをプロンプトに入れることで、歴史資料のテキスト記述から震度という数値情報が得られるようになった。
[5] 研究コミュニティとの連携を進めるため、Linked Pasts 10国際会議を主催し、デジタルヒストリー分野におけるLinked Dataの活用について議論した。また、IIIF Curation Platformバージョン2のオープンソース公開を進めるなど、オープンソース・オープンデータの面でも研究成果を積極的に公開した。

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

本年度の研究実施計画として想定していた項目はほぼ達成することができ、一部の項目については想定以上の成果を達成できた。

今後の研究の推進方策

本研究の大きな目標は「史料とデータ駆動型モデルの接続」にある。この目標を達成するために、最終年度は以下の課題に取り組む。
[1] 文書空間と実体空間を接続するデータモデル「れきろく」については、両空間における識別子の整備とGeoLODなどを用いたAPI化、さらには作業用のユーザインタフェースの構築を進めることで、実際のアプリにおける活用事例を増やす。
[2] 市区町村IDや藩IDなどの識別子を公開することで、識別子を活用したデータ構造化を複数のアプリで進める。また、他の研究プロジェクトでの活用を進める際の具体的課題についても研究を進める。
[3] 安政江戸地震などの歴史地震を対象として、AIを活用したデータ構造化に取り組むことで、より高解像度かつマルチモーダルな歴史データの構築を進める。
[4] 生成AIを活用したアプリについては、くずし字認識モデルRURIを中心にいくつかのOCRと連携することで、より多様な資料を読み込んでAIチャットが行えるようにシステムの拡張を進める。
[5] CODHセミナーを複数回開催することで、本プロジェクトの成果を公表するとともに、歴史ビッグデータに関する各種のデータやツールの使い方も研究コミュニティに広める。

報告書

(3件)
  • 2024 実績報告書
  • 2023 審査結果の所見   実績報告書
  • 研究成果

    (40件)

すべて 2025 2024 2023 その他

すべて 雑誌論文 (13件) (うち査読あり 8件、 オープンアクセス 1件) 学会発表 (21件) (うち国際学会 4件、 招待講演 9件) 備考 (6件)

  • [雑誌論文] 地震史料のGISデータ化の意義と課題2025

    • 著者名/発表者名
      大邑潤三
    • 雑誌名

      月刊地球

      巻: 47 ページ: 184-194

    • 関連する報告書
      2024 実績報告書
  • [雑誌論文] 歴史ビッグデータ:歴史資料から機械可読データを構築するためのデータ構造化ワークフロー2024

    • 著者名/発表者名
      北本 朝展
    • 雑誌名

      都市計画

      巻: 73 ページ: 42-45

    • 関連する報告書
      2024 実績報告書
  • [雑誌論文] IIIF Tsukushi Viewer: 日本古典籍へのアクセス性を向上させる生成AIチャット機能2024

    • 著者名/発表者名
      北本 朝展, 本間 淳, カラーヌワット タリン
    • 雑誌名

      情報処理学会技術報告

      巻: 2024-CH-136 ページ: 1-8

    • 関連する報告書
      2024 実績報告書
  • [雑誌論文] A Machine Learning Approach to Identify Printing Blocks for Japanese Kokatsuji (Old Movable Type) Books2024

    • 著者名/発表者名
      Yuxiao Li, Asanobu KITAMOTO
    • 雑誌名

      Digital Humanities 2024

      巻: 1 ページ: 440-444

    • 関連する報告書
      2024 実績報告書
    • 査読あり
  • [雑誌論文] GeoLOD: A Toponym Platform to Connect Japanese Historical Gazetteers and Historical Big Data Apps2024

    • 著者名/発表者名
      Asanobu KITAMOTO, Yuta HASHIMOTO, Yasuyuki KANO, Junzo OMURA
    • 雑誌名

      Digital Humanities 2024

      巻: 1 ページ: 359-363

    • 関連する報告書
      2024 実績報告書
    • 査読あり
  • [雑誌論文] Deep Learning for the Identification of Ex-libris Stamps (Zoshoin) in Old Japanese Books2024

    • 著者名/発表者名
      Irene Gentilini, Asanobu KITAMOTO
    • 雑誌名

      Digital Humanities 2024

      巻: 1 ページ: 205-207

    • 関連する報告書
      2024 実績報告書
    • 査読あり
  • [雑誌論文] Beyond OCR: Enhancing Classical Japanese Transcription with Large Language Models"2024

    • 著者名/発表者名
      Tarin CLANUWAT, Tianyu Zhao, Yuki Imajuku, Asanobu KITAMOTO
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2024論文集

      巻: 1 ページ: 75-82

    • 関連する報告書
      2024 実績報告書
    • 査読あり
  • [雑誌論文] 歴史ビッグデータ構造化による安政江戸地震被害記録の分析2024

    • 著者名/発表者名
      北本 朝展, 橋本 雄太, 大邑 潤三, 加納 靖之
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2024論文集

      巻: 1 ページ: 37-44

    • 関連する報告書
      2024 実績報告書
    • 査読あり
  • [雑誌論文] クラウドソーシングによる天保郷帳の全文翻刻と地理データセット化2024

    • 著者名/発表者名
      橋本 雄太, 大邑 潤三, 加納 靖之, 北本 朝展
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2024論文集

      巻: 1 ページ: 261-266

    • 関連する報告書
      2024 実績報告書
    • 査読あり
  • [雑誌論文] Minna de Honkoku: Citizen-Participation Transcription Project for Japanese Historical Documents2024

    • 著者名/発表者名
      Kano Yasuyuki, Hashimoto Yuta
    • 雑誌名

      Annual Review of Earth and Planetary Sciences

      巻: 53 号: 1 ページ: 1-18

    • DOI

      10.1146/annurev-earth-040523-120834

    • 関連する報告書
      2024 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 地名の情報学と歴史地名データベース構想2023

    • 著者名/発表者名
      北本 朝展
    • 雑誌名

      月刊「地理」

      巻: 68 ページ: 48-55

    • 関連する報告書
      2023 実績報告書
  • [雑誌論文] そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有2023

    • 著者名/発表者名
      北本 朝展, 本間 淳, カラーヌワット タリン
    • 雑誌名

      人文科学とコンピュータシンポジウム じんもんこん2023論文集

      巻: 1 ページ: 51-58

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] みんなで翻刻ー歴史災害資料のシチズンサイエンス2023

    • 著者名/発表者名
      橋本雄太, 加納靖之
    • 雑誌名

      科学

      巻: 93 ページ: 926-929

    • 関連する報告書
      2023 実績報告書
  • [学会発表] 文化財×AI:パラダイムシフトにどう向き合うか?2025

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      文化領域と最先端技術 第3回研究会
    • 関連する報告書
      2024 実績報告書
    • 招待講演
  • [学会発表] 歴史的ベースレジストリ:時間軸を延伸した基盤データに向けて2025

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      地理空間情報に関するベースレジストリ利活用研究会 第12回
    • 関連する報告書
      2024 実績報告書
    • 招待講演
  • [学会発表] 江戸全藩を対象とした藩IDの構築2024

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      デジタライジング研究会
    • 関連する報告書
      2024 実績報告書
  • [学会発表] 華北交通アーカイブにおけるAIやデジタル技術の活用2024

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      シンポジウム「日本の写真遺産と芸術遺産の研究のための新デジタルツール」
    • 関連する報告書
      2024 実績報告書
    • 招待講演
  • [学会発表] Linked Pasts Japan: A Japanese Community for Collaborating Linked Data and Historical & Heritage Studies2024

    • 著者名/発表者名
      Jun OGAWA, Tatsuki SEKINO, Yuta HASHIMOTO, Goki MIYAKITA, Natsuko YOSHIGA, Asanobu KITAMOTO
    • 学会等名
      13th Conference of Japanese Association for Digital Humanities (JADH2024)
    • 関連する報告書
      2024 実績報告書
    • 国際学会
  • [学会発表] 日本文化と歴史ビッグデータ:過去と現在のギャップを縮めるAI2024

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      応用物理学会超集積エレクトロニクス産学連携委員会 第10回研究会
    • 関連する報告書
      2024 実績報告書
    • 招待講演
  • [学会発表] 対話型生成AIを用いた歴史地震の震度判定の試み2024

    • 著者名/発表者名
      大邑 潤三, 北本 朝展, 加納 靖之, 橋本 雄太
    • 学会等名
      日本地震学会2024年度秋季大会
    • 関連する報告書
      2024 実績報告書
  • [学会発表] 江戸ビッグデータのオープン化:「れきちず」を活用した歴史的地理情報基盤に向けて2024

    • 著者名/発表者名
      北本 朝展, 加藤 創
    • 学会等名
      FOSS4G 2024 Japan
    • 関連する報告書
      2024 実績報告書
  • [学会発表] IIIF Curation Platform: Recent Developments to Support Large Language Models and the Latest APIs2024

    • 著者名/発表者名
      Asanobu KITAMOTO, Jun HOMMA
    • 学会等名
      2024 IIIF Online Meeting
    • 関連する報告書
      2024 実績報告書
    • 国際学会
  • [学会発表] IIIF Tsukushi Viewer:生成AIチャットがアシストする日本古典籍の新しい読み方2024

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      第27回DAショートトーク
    • 関連する報告書
      2024 実績報告書
    • 招待講演
  • [学会発表] Japanese Toponym Platforms for the Past and the Present : GeoLOD, GeoNLP, Geoshape, Rekichime, and Rekichizu2024

    • 著者名/発表者名
      Asanobu KITAMOTO
    • 学会等名
      Joint Symposium of Linked Pasts 10 and Linked Pasts Japan 1
    • 関連する報告書
      2024 実績報告書
    • 国際学会
  • [学会発表] Linked Pasts for Japan: A Vision for the Historical Big Data Platform and the Digital Humanities Consortium2024

    • 著者名/発表者名
      Asanobu KITAMOTO
    • 学会等名
      Joint Symposium of Linked Pasts 10 and Linked Pasts Japan 1
    • 関連する報告書
      2024 実績報告書
    • 国際学会
  • [学会発表] 著作性のある資料とオープン・クローズ戦略:『日本歴史地名大系』や『れきちず』の事例2024

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      DHデータ構築検討会「著作権保護対象資料を活用したオープンデータ化の道筋を拓く」
    • 関連する報告書
      2024 実績報告書
    • 招待講演
  • [学会発表] 『新収日本地震史料』の編纂時資料のデジタル化2024

    • 著者名/発表者名
      加納靖之, 大邑潤三
    • 学会等名
      第41回歴史地震研究会
    • 関連する報告書
      2024 実績報告書
  • [学会発表] クラウドソーシングとAI文字認識を駆使した 「くずし字」資料の大規模テキスト化2024

    • 著者名/発表者名
      橋本雄太
    • 学会等名
      第19回言語処理学会若手の会(YANS2024)
    • 関連する報告書
      2024 実績報告書
  • [学会発表] 武鑑全集:空間的・時間的な構造化データを構築する効率的なワークフローの探求と江戸長期時系列データの構築2024

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      デジタライジング研究会
    • 関連する報告書
      2023 実績報告書
    • 招待講演
  • [学会発表] 出版社との協働による『日本歴史地名大系』の一部オープンデータ化と『歴史的行政区域データセット』との統合2023

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      第22回歴史ビッグデータ研究会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 歴史的行政区域データセットの拡大と歴史ビッグデータ研究への活用2023

    • 著者名/発表者名
      北本 朝展, 村田 健史
    • 学会等名
      日本地球惑星科学連合(JpGU)2023年大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] GeoとNLPをつなぐ地名の情報学2023

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      地理空間情報と自然言語処理勉強会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 歴史ビッグデータにおける時空間データの利活用2023

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      第3回人間文化研究機構DH研究会「DHデータ基盤としてのデータセット~利用と提供から考える」
    • 関連する報告書
      2023 実績報告書
    • 招待講演
  • [学会発表] 歴史地理データから考える人文学DXの未来像2023

    • 著者名/発表者名
      北本 朝展
    • 学会等名
      国際シンポジウム:デジタル・ヒューマニティーズと研究基盤
    • 関連する報告書
      2023 実績報告書
    • 招待講演
  • [備考] 『日本歴史地名大系』地名項目データセット

    • URL

      https://geoshape.ex.nii.ac.jp/nrct/

    • 関連する報告書
      2024 実績報告書 2023 実績報告書
  • [備考] 歴史的行政区域データセットβ版

    • URL

      https://geoshape.ex.nii.ac.jp/city/

    • 関連する報告書
      2024 実績報告書 2023 実績報告書
  • [備考] 武鑑全集

    • URL

      http://codh.rois.ac.jp/bukan/

    • 関連する報告書
      2024 実績報告書 2023 実績報告書
  • [備考] edomi

    • URL

      http://codh.rois.ac.jp/edomi/

    • 関連する報告書
      2024 実績報告書 2023 実績報告書
  • [備考] 江戸期地理データセット

    • URL

      https://geoshape.ex.nii.ac.jp/edo/

    • 関連する報告書
      2024 実績報告書
  • [備考] みんなで注釈

    • URL

      https://ansei2.vercel.app/

    • 関連する報告書
      2023 実績報告書

URL: 

公開日: 2023-04-13   更新日: 2025-12-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi