• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

IIIFとTEIを用いたオンライン翻刻支援システムの開発

研究課題

研究課題/領域番号 19K20626
研究機関東京大学

研究代表者

中村 覚  東京大学, 史料編纂所, 助教 (80802743)

研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードIIIF / TEI / OCR / Omeka / 人文情報学 / デジタルアーカイブ / 翻刻 / RDF
研究実績の概要

本研究の目的は、オンライン上で複数の利用者が協力して史料を翻刻可能なシステムを開発することである。特に、画像共有のための国際標準であるIIIFや、人文学資料向けの構造化ルールを定めるTEI等の国際規格に適合させることで、幅広い用途・国際的に活用可能なシステム構築を志向する。この目標を達成するために、オープンソースのデジタルコンテンツ管理システム「Omeka」及びその翻刻用のプラグインである「Scripto」を基盤とし、IIIF準拠の画像データを入力として、オンライン上で複数人が翻刻作業を行い、翻刻成果をTEI準拠形式でエクスポートできるシステムを構築した。加えて、国立国会図書館が提供するオープンソースのOCRソフトウェア「NDL OCR」や、人文学オープンデータ共同利用センターが公開するくずし字認識サービス「KuroNet」等のOCRソフトウェアを利用し、翻刻対象史料の下書きテキストを組み込む手順を実装した。

この成果として、画像と多様なテキストデータを関連付け、「源氏物語」の本文研究支援を目指すウェブサイト「デジタル源氏物語」を公開した。また、翻刻した『校異源氏物語』のテキストデータを公開する「校異源氏物語テキストDB」、くずし字OCRと編集距離を活用し、テキストデータが類似する写本・版本の画像の推薦機能を提供する「デジタル源氏物語(AI画像検索版)」の公開も行った。

これらの取り組みが評価され、2021年にデジタルアーカイブ学会から実践賞、2022年に情報処理学会から山下記念研究賞を授与された。

  • 研究成果

    (19件)

すべて 2023 2022 その他

すべて 雑誌論文 (10件) (うち査読あり 6件、 オープンアクセス 5件) 学会発表 (6件) (うち国際学会 6件) 備考 (3件)

  • [雑誌論文] Rubi as a Text: A Note on the Ruby Gloss Encoding2023

    • 著者名/発表者名
      Kazuhiro Okada, Satoru Nakamura, Kiyonori Nagasaki
    • 雑誌名

      Journal of the Text Encoding Initiative

      巻: 14 ページ: -

    • DOI

      10.4000/jtei.4403

    • 査読あり / オープンアクセス
  • [雑誌論文] 知識グラフを用いた歴史資料の構造化:TEIとRDFの活用2022

    • 著者名/発表者名
      小川潤, 大向一輝, 中村覚, 北本朝展
    • 雑誌名

      情報知識学会誌

      巻: 32 ページ: 428-431

    • DOI

      10.2964/jsik_2022_041

    • オープンアクセス
  • [雑誌論文] TEIデータに対する可視化・分析ツールの開発2022

    • 著者名/発表者名
      中村覚
    • 雑誌名

      情報知識学会誌

      巻: 32 ページ: 389-392

    • DOI

      10.2964/jsik_2022_033

    • オープンアクセス
  • [雑誌論文] Using Archivematica and Omeka S for Long-Term Preservation and Access of Digitized Archive Materials2022

    • 著者名/発表者名
      Boyoung Kim, Satoru Nakamura, Hidenori Watanave
    • 雑誌名

      From Born-Physical to Born-Virtual: Augmenting Intelligence in Digital Libraries

      巻: - ページ: 241-250

    • DOI

      10.1007/978-3-031-21756-2_20

    • 査読あり / オープンアクセス
  • [雑誌論文] 研究資源としてのWEB APIの利用:歴史資料・古典籍の字形を横断的に検索するアプリケーションの開発2022

    • 著者名/発表者名
      劉冠偉, 中村覚, 山田太造
    • 雑誌名

      じんもんこん2022論文集

      巻: 2022 ページ: 165-170

    • 査読あり
  • [雑誌論文] 日本史史料データプラットフォーム構築に向けた取り組みと課題2022

    • 著者名/発表者名
      山田太造, 中村覚, 劉冠偉, 井上聡
    • 雑誌名

      じんもんこん2022論文集

      巻: 2022 ページ: 249-256

    • 査読あり
  • [雑誌論文] 構造化テキストデータの活用における現状と課題 ―TEIに準拠した『浄土真宗聖典全書』全文検索システムの開発を通じて―2022

    • 著者名/発表者名
      永崎 研宣, 中村 覚, 田中 真, 西河 雅人, 林 龍樹, 井上 慶淳, 下田 正弘
    • 雑誌名

      じんもんこん2022論文集

      巻: 2022 ページ: 73-78

    • 査読あり
  • [雑誌論文] 花押を対象としたデータ駆動型歴史情報学研究の実践2022

    • 著者名/発表者名
      中村覚, 劉冠偉, 宮﨑肇, 井上聡, 大山航, 山田太造
    • 雑誌名

      じんもんこん2022論文集

      巻: 2022 ページ: 171-178

    • 査読あり
  • [雑誌論文] [B2] 真正なデジタル化資料の長期保存と公開:ArchivematicaとOmeka Sを用いた事例2022

    • 著者名/発表者名
      金甫榮, 中村覚, 渡邉 英徳
    • 雑誌名

      デジタルアーカイブ学会誌

      巻: 6 ページ: s147-s150

    • DOI

      10.24506/jsda.6.s3_s147

    • オープンアクセス
  • [雑誌論文] NDLOCRを用いた東京大学史料編纂所史料集版面画像に対する検索システムの開発2022

    • 著者名/発表者名
      中村覚, 劉冠偉, 山田太造
    • 雑誌名

      研究報告人文科学とコンピュータ(CH)

      巻: 2022-CH-130 ページ: 1-8

  • [学会発表] Building Interfaces for East Asian/Japanese TEI data2022

    • 著者名/発表者名
      K. Nagasaki, S. Nakamura, K. Okada
    • 学会等名
      TEI Conference and Members' Meeting 2022
    • 国際学会
  • [学会発表] Developing a Comprehensive Application for Digital Transformation of Historical Materials2022

    • 著者名/発表者名
      Shibutani, Ayako, Nakamura, Satoru, Yamada, Taizo, Yanbe, Koki
    • 学会等名
      Digital Humanities 2022
    • 国際学会
  • [学会発表] Application for visualizing and analyzing the historical network with context-centric model2022

    • 著者名/発表者名
      Ogawa, Jun, Nakamura, Satoru, Nagasaki, Kiyonori, Ohmukai, Ikki
    • 学会等名
      Digital Humanities 2022
    • 国際学会
  • [学会発表] Building a Knowledge Base for Data-Driven Historical Information Research Infrastructure and Its Application with Historical Painting Materials2022

    • 著者名/発表者名
      Nakamura, Satoru, Suda, Makiko, Kuroshima, Satoru, Inoue, Satoshi, Yamada, Taizo
    • 学会等名
      Digital Humanities 2022
    • 国際学会
  • [学会発表] A Unicode Input Support Tool for Searching Chinese Characters by Components and Stroke Number2022

    • 著者名/発表者名
      Liu, Guanwei, Nakamura, Satoru, Yamada, Taizo
    • 学会等名
      Digital Humanities 2022
    • 国際学会
  • [学会発表] Crowdsourcing as Collaborative Learning: A Participatory Annotation Project for the Photographic Materials of Shibusawa Eiichi2022

    • 著者名/発表者名
      Hashimoto, Yuta, Kim, Boyoung, Nakamura, Satoru, Kokaze, Naoki, Inoue, Sayaka, Shigehara, Toru, Nagasaki, Kiyonori
    • 学会等名
      Digital Humanities 2022
    • 国際学会
  • [備考] デジタル源氏物語

    • URL

      https://genji.dl.itc.u-tokyo.ac.jp/

  • [備考] 校異源氏物語テキストDB

    • URL

      https://kouigenjimonogatari.github.io/

  • [備考] デジタル源氏物語(AI画像検索版)

    • URL

      https://genji-ai.web.app/

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi