• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Development of Online Transcription System with IIIF and TEI

Research Project

Project/Area Number 19K20626
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionThe University of Tokyo

Principal Investigator

Nakamura Satoru  東京大学, 史料編纂所, 助教 (80802743)

Project Period (FY) 2019-04-01 – 2023-03-31
Project Status Completed (Fiscal Year 2022)
Budget Amount *help
¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
KeywordsIIIF / TEI / RDF / OCR / Omeka / 人文情報学 / デジタルアーカイブ / 翻刻 / くずし字OCR / 編集距離 / 源氏物語 / VSCode / くずし字
Outline of Research at the Start

本研究の目的は、オンライン上で複数のユーザが共同で史料を翻刻可能なシステムを開発することである。特に、IIIFやTEI等の国際標準規格に準拠することにより、汎用的・国際的に利用可能なシステムの構築を目指す。具体的には、IIIF準拠の画像を入力データとして、IIIF準拠で公開されている様々な史料を翻刻対象として登録可能とする。また、システムに登録されたテキストデータをTEI準拠の形式でエクスポートする機能を提供し、テキストデータの長期保存およびシステムに依存しない多様な利活用を支援する。さらに、東京大学柏図書館が所蔵する『平賀譲文書』を対象とした翻刻作業を実施し、システムの利用可能性を示す。

Outline of Final Research Achievements

The objective of this research is to construct a system that allows multiple users to collaboratively transcribe historical materials online. Significantly, by ensuring compliance with international standards such as IIIF, an international standard for image sharing, and TEI, which stipulates structured rules for humanities resources, we have developed a versatile and internationally applicable system. Utilizing this system, we have associated diverse textual data with images about “The Tale of Genji” and launched the “Digital Tale of Genji” website, aiming to facilitate scholarly research on the text. Furthermore, we have released the “Digital Tale of Genji (AI Image Search)”, which provides features that utilize Kuzushiji OCR and edit distance to automatically recommend images of manuscripts and editions with similar textual data.

Academic Significance and Societal Importance of the Research Achievements

本研究はIIIFおよびTEIなどの国際規格に準拠した、オンライン上での史料翻刻システムの開発により、人文情報学分野の発展に寄与した。また多様なテキストデータと画像を統合することで、「デジタル源氏物語」ウェブサイトの公開など、学術研究基盤の強化に貢献した。さらにくずし字OCRの利用、およびテキストデータが類似する写本・版本の画像を自動的に推奨する機能の組み合わせにより、歴史資料の新しい活用方法を提案した。デジタルアーカイブ学会と情報処理学会から評価されたこれらの取り組みは、歴史資料へのアクセスを容易とし、国際的な学術研究を促進する。

Report

(5 results)
  • 2022 Annual Research Report   Final Research Report ( PDF )
  • 2021 Research-status Report
  • 2020 Research-status Report
  • 2019 Research-status Report
  • Research Products

    (43 results)

All 2023 2022 2021 2020 2019 Other

All Journal Article (24 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 16 results,  Open Access: 7 results) Presentation (12 results) (of which Int'l Joint Research: 6 results) Remarks (7 results)

  • [Journal Article] Rubi as a Text: A Note on the Ruby Gloss Encoding2023

    • Author(s)
      Kazuhiro Okada, Satoru Nakamura, Kiyonori Nagasaki
    • Journal Title

      Journal of the Text Encoding Initiative

      Volume: 14 Issue: Issue 14 Pages: 0-0

    • DOI

      10.4000/jtei.4403

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Historical Knowledge Graph: Use of TEI and RDF2022

    • Author(s)
      小川 潤, 大向 一輝, 中村 覚, 北本 朝展
    • Journal Title

      Joho Chishiki Gakkaishi

      Volume: 32 Issue: 4 Pages: 428-431

    • DOI

      10.2964/jsik_2022_041

    • ISSN
      0917-1436, 1881-7661
    • Year and Date
      2022-12-18
    • Related Report
      2022 Annual Research Report
    • Open Access
  • [Journal Article] Development of visualization and analysis tools for TEI data2022

    • Author(s)
      中村覚
    • Journal Title

      Joho Chishiki Gakkaishi

      Volume: 32 Issue: 4 Pages: 389-392

    • DOI

      10.2964/jsik_2022_033

    • ISSN
      0917-1436, 1881-7661
    • Year and Date
      2022-12-18
    • Related Report
      2022 Annual Research Report
    • Open Access
  • [Journal Article] Using Archivematica and Omeka S for Long-Term Preservation and Access of Digitized Archive Materials2022

    • Author(s)
      Boyoung Kim, Satoru Nakamura, Hidenori Watanave
    • Journal Title

      From Born-Physical to Born-Virtual: Augmenting Intelligence in Digital Libraries

      Volume: - Pages: 241-250

    • DOI

      10.1007/978-3-031-21756-2_20

    • ISBN
      9783031217555, 9783031217562
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 研究資源としてのWEB APIの利用:歴史資料・古典籍の字形を横断的に検索するアプリケーションの開発2022

    • Author(s)
      劉冠偉, 中村覚, 山田太造
    • Journal Title

      じんもんこん2022論文集

      Volume: 2022 Pages: 165-170

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 日本史史料データプラットフォーム構築に向けた取り組みと課題2022

    • Author(s)
      山田太造, 中村覚, 劉冠偉, 井上聡
    • Journal Title

      じんもんこん2022論文集

      Volume: 2022 Pages: 249-256

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 構造化テキストデータの活用における現状と課題 ―TEIに準拠した『浄土真宗聖典全書』全文検索システムの開発を通じて―2022

    • Author(s)
      永崎 研宣, 中村 覚, 田中 真, 西河 雅人, 林 龍樹, 井上 慶淳, 下田 正弘
    • Journal Title

      じんもんこん2022論文集

      Volume: 2022 Pages: 73-78

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 花押を対象としたデータ駆動型歴史情報学研究の実践2022

    • Author(s)
      中村覚, 劉冠偉, 宮﨑肇, 井上聡, 大山航, 山田太造
    • Journal Title

      じんもんこん2022論文集

      Volume: 2022 Pages: 171-178

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] [B2] Long-term Preservation and Publication of Authentic Digitized Archive Materials: A Case Study Using Archivematica and Omeka S2022

    • Author(s)
      金甫榮, 中村覚, 渡邉英徳
    • Journal Title

      Dejitaru Akaibu Gakkaishi

      Volume: 6 Issue: s3 Pages: s147-s150

    • DOI

      10.24506/jsda.6.s3_s147

    • ISSN
      2432-9762, 2432-9770
    • Related Report
      2022 Annual Research Report
    • Open Access
  • [Journal Article] NDLOCRを用いた東京大学史料編纂所史料集版面画像に対する検索システムの開発2022

    • Author(s)
      中村覚, 劉冠偉, 山田太造
    • Journal Title

      研究報告人文科学とコンピュータ(CH)

      Volume: 2022-CH-130 Pages: 1-8

    • Related Report
      2022 Annual Research Report
  • [Journal Article] デジタル源氏物語(AI画像検索版):くずし字OCRと編集距離を用いた写本・版本の比較支援システムの開発2022

    • Author(s)
      中村 覚, 田村 隆, 永崎 研宣
    • Journal Title

      研究報告人文科学とコンピュータ(CH)

      Volume: 2022-CH-128(13) Pages: 1-8

    • Related Report
      2021 Research-status Report
  • [Journal Article] 部品と画数で漢字を検索するためのUnicode入力支援ツール2022

    • Author(s)
      劉 冠偉, 中村 覚, 山田 太造
    • Journal Title

      研究報告人文科学とコンピュータ(CH)

      Volume: 2022-CH-128(2) Pages: 1-4

    • Related Report
      2021 Research-status Report
  • [Journal Article] 日本中世古記録を対象としたトピック抽出自動化システムの構築2022

    • Author(s)
      鳥居 克哉, 中村 覚, 山田 太造, 稗方 和夫
    • Journal Title

      研究報告人文科学とコンピュータ(CH)

      Volume: 2022-CH-128(8) Pages: 1-6

    • Related Report
      2021 Research-status Report
  • [Journal Article] Proposal to develop Digital Archive System considering Sustainability and Reusability2021

    • Author(s)
      中村覚、高嶋朋子
    • Journal Title

      Dejitaru Akaibu Gakkaishi

      Volume: 5 Issue: 1 Pages: 56-60

    • DOI

      10.24506/jsda.5.1_56

    • NAID

      130007990676

    • ISSN
      2432-9762, 2432-9770
    • Year and Date
      2021-01-12
    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 相互運用性を高めた日本歴史資料データ実装:『延喜式』TEI と IIIF を事例として2021

    • Author(s)
      小風 尚樹, 中村 覚, 永崎 研宣, 渡辺 美紗子, 戸村 美月, 小風 綾乃, 清武 雄二, 後藤 真, 小倉 慈司
    • Journal Title

      じんもんこん2021論文集

      Volume: 2021 Pages: 294-301

    • NAID

      170000186267

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] 写真資料のクラウドアノテーションシステムの開発: 『渋沢栄一伝記資料」別巻第 10 を事例に2021

    • Author(s)
      橋本雄太, 金甫榮, 中村覚, 小風尚樹, 井上さやか, 茂原暢, 永崎研宣
    • Journal Title

      じんもんこん2021論文集

      Volume: 2021 Pages: 132-137

    • NAID

      170000186291

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] データ駆動型歴史情報研究基盤の構築に向けた知識ベースの構築とその活用: 絵図史料を対象として2021

    • Author(s)
      中村覚, 須田牧子, 黒嶋敏, 井上聡, 山田太造
    • Journal Title

      じんもんこん2021論文集

      Volume: 2021 Pages: 88-95

    • NAID

      170000186297

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] 日本史史料を対象とした研究データ基盤整備における課題2021

    • Author(s)
      山田太造, 中村覚, 渋谷綾子, 大向一輝, 井上聡
    • Journal Title

      じんもんこん2021論文集

      Volume: 2021 Pages: 80-87

    • NAID

      170000186298

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] Development of data-driven historical information research infrastructure at the Historiographical Institute in the University of Tokyo2021

    • Author(s)
      Satoru Nakamura, Taizo Yamada
    • Journal Title

      The 11th International Conference of Japanese Association for Digital Humanities

      Volume: 11 Pages: 148-151

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] Development of a support system for extracting mentioned bibliographical data from the Encyclop_die entries2021

    • Author(s)
      Satoru Nakamura, Ayano Kokaze, Yoshiho Iida, Naoki Kokaze, Tatsuo Hemmi
    • Journal Title

      The 11th International Conference of Japanese Association for Digital Humanities

      Volume: 11 Pages: 130-133

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] Reconstruction and Utilization of Text Data Using TEI: Case study of the Shibusawa Eiichi Denki Shiryo2021

    • Author(s)
      Boyoung Kim, Satoru Nakamura, Yuta Hashimoto, Naoki Kokaze, Sayaka Inoue, Toru Shigehara, Kiyonori Nagasaki
    • Journal Title

      The 11th International Conference of Japanese Association for Digital Humanities

      Volume: 11 Pages: 126-129

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] The University of Tokyo Digital Archives Development Project: Developing an Approach for Utilizing Academic Assets across Different Organizations2020

    • Author(s)
      Satoru Nakamura
    • Journal Title

      The National Museum of Japanese History. Japanese and Asian Historical Research In the Digital Age

      Volume: 2021 Pages: 17-36

    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] TEIを用いた『渋沢栄一伝記資料』テキストデータの再構築2020

    • Author(s)
      金 甫榮, 中村 覚, 小風 尚樹, 橋本 雄太, 井上 さやか, 茂原 暢, 永崎 研宣
    • Journal Title

      じんもんこん2020論文集

      Volume: 2020 Pages: 47-52

    • NAID

      170000183911

    • Related Report
      2020 Research-status Report
    • Peer Reviewed
  • [Journal Article] 源氏物語本文研究支援システム「デジタル源氏物語」の開発におけるIIIF・TEIの活用2020

    • Author(s)
      中村覚, 田村隆, 永崎研宣
    • Journal Title

      研究報告人文科学とコンピュータ(CH)

      Volume: 2020-CH-124 Pages: 1-7

    • Related Report
      2020 Research-status Report
  • [Presentation] Building Interfaces for East Asian/Japanese TEI data2022

    • Author(s)
      K. Nagasaki, S. Nakamura, K. Okada
    • Organizer
      TEI Conference and Members' Meeting 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Developing a Comprehensive Application for Digital Transformation of Historical Materials2022

    • Author(s)
      Shibutani, Ayako, Nakamura, Satoru, Yamada, Taizo, Yanbe, Koki
    • Organizer
      Digital Humanities 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Application for visualizing and analyzing the historical network with context-centric model2022

    • Author(s)
      Ogawa, Jun, Nakamura, Satoru, Nagasaki, Kiyonori, Ohmukai, Ikki
    • Organizer
      Digital Humanities 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Building a Knowledge Base for Data-Driven Historical Information Research Infrastructure and Its Application with Historical Painting Materials2022

    • Author(s)
      Nakamura, Satoru, Suda, Makiko, Kuroshima, Satoru, Inoue, Satoshi, Yamada, Taizo
    • Organizer
      Digital Humanities 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] A Unicode Input Support Tool for Searching Chinese Characters by Components and Stroke Number2022

    • Author(s)
      Liu, Guanwei, Nakamura, Satoru, Yamada, Taizo
    • Organizer
      Digital Humanities 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Crowdsourcing as Collaborative Learning: A Participatory Annotation Project for the Photographic Materials of Shibusawa Eiichi2022

    • Author(s)
      Hashimoto, Yuta, Kim, Boyoung, Nakamura, Satoru, Kokaze, Naoki, Inoue, Sayaka, Shigehara, Toru, Nagasaki, Kiyonori
    • Organizer
      Digital Humanities 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 東京大学デジタルアーカイブズ構築事業の取り組みとその利活用について2021

    • Author(s)
      中村覚
    • Organizer
      2020年度KU-ORCAS国際シンポジウム:デジタルヒューマニティーズ推進のための環境構築とその課題
    • Related Report
      2020 Research-status Report
  • [Presentation] IIIF Curation Platformを用いたデジタルアーカイブの活用2021

    • Author(s)
      中村覚
    • Organizer
      第14回CODHセミナー:IIIF Curation Platform利活用レシピ100連発
    • Related Report
      2020 Research-status Report
  • [Presentation] 源氏物語本文研究支援システム「デジタル源氏物語」の開発におけるIIIFとTEIの活用2021

    • Author(s)
      中村覚
    • Organizer
      U-PARL [協働型アジア研究オンラインセミナー]IIIFに準拠した画像公開の方法とTEIとの連携
    • Related Report
      2020 Research-status Report
  • [Presentation] 「デジタル源氏物語」の構築と展開2020

    • Author(s)
      田村隆, 中村覚, 中村美里, 永崎研宣
    • Organizer
      国文学研究資料館 第6回日本語の歴史的典籍国際研究集会
    • Related Report
      2020 Research-status Report
  • [Presentation] デジタルアーカイブ活用のために 最新技術の紹介2019

    • Author(s)
      中村覚
    • Organizer
      第3回東京大学学術資産アーカイブ化推進室主催セミナー
    • Related Report
      2019 Research-status Report
  • [Presentation] 東大本『源氏物語』と新たな本文研究プラットフォーム2019

    • Author(s)
      田村隆
    • Organizer
      第3回東京大学学術資産アーカイブ化推進室主催セミナー
    • Related Report
      2019 Research-status Report
  • [Remarks] デジタル源氏物語

    • URL

      https://genji.dl.itc.u-tokyo.ac.jp/

    • Related Report
      2022 Annual Research Report 2020 Research-status Report
  • [Remarks] 校異源氏物語テキストDB

    • URL

      https://kouigenjimonogatari.github.io/

    • Related Report
      2022 Annual Research Report 2020 Research-status Report 2019 Research-status Report
  • [Remarks] デジタル源氏物語(AI画像検索版)

    • URL

      https://genji-ai.web.app/

    • Related Report
      2022 Annual Research Report 2021 Research-status Report 2020 Research-status Report
  • [Remarks] 倭寇図巻デジタルアーカイブ

    • URL

      https://www.hi.u-tokyo.ac.jp/collection/degitalgallary/wakozukan/

    • Related Report
      2021 Research-status Report
  • [Remarks] 渋沢栄一ダイアリー

    • URL

      https://shibusawa-dlab.github.io/app1/

    • Related Report
      2021 Research-status Report
  • [Remarks] デジタル延喜式

    • URL

      https://khirin-t.rekihaku.ac.jp/engishiki/

    • Related Report
      2021 Research-status Report
  • [Remarks] デジタル源氏物語

    • URL

      https://genji.dl.itc.u-tokyo.ac.jp/app/#/

    • Related Report
      2019 Research-status Report

URL: 

Published: 2019-04-18   Modified: 2024-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi