• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Digital text archiving for cursive writing documents by using the reading voice of which the experts read aloud.

Research Project

Project/Area Number 21K18372
Research Category

Grant-in-Aid for Challenging Research (Exploratory)

Allocation TypeMulti-year Fund
Review Section Medium-sized Section 2:Literature, linguistics, and related fields
Research InstitutionRitsumeikan University

Principal Investigator

Akama Ryo  立命館大学, 文学部, 教授 (70212412)

Co-Investigator(Kenkyū-buntansha) 西浦 敬信  立命館大学, 情報理工学部, 教授 (70343275)
山路 正憲  立命館大学, 衣笠総合研究機構, 研究員 (00899049)
Project Period (FY) 2021-07-09 – 2024-03-31
Project Status Completed (Fiscal Year 2023)
Budget Amount *help
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2021: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords形態素解析 / UNIDIC / 古典籍 / 古文書 / 翻刻 / 翻刻支援 / 変体仮名 / 音声入力 / 自動変換 / 形態解析
Outline of Research at the Start

歴史的典籍・古文書の翻刻デジタルアーカイブを進める上で、AI画像認識を使った自動翻刻技術が進展しているが、その正答率はいまだ十分ではなく、100%正確なテキストアーカイブが課題となってきている。本研究では、その一つの方策として、熟練者の解読能力を活用し、かつ熟練者の負担を出来る限り軽減して翻刻テキストを作成するため、熟練者の読上げ音声を、読み上げ時の本文テキスト情報以外のノイズを極力軽減して、電子テキスト化し、立命館ARCの初心者の育成・教育ができる「翻刻支援システム」とを連携させ、ツールの一つとしてシステムに加え、従来の翻刻量を圧倒的に凌駕するシステムを開発する。

Outline of Final Research Achievements

While automated transcription technology using AI image recognition is advancing in the digital archiving of transcribed historical books and documents, many of the people who have the ability to decipher ancient documents are elderly and often have difficulty with keyboard input. In this study, we developed a system to record the "manuscript" of the transcribed text by having a person with deciphering ability read the document aloud. We were able to incorporate the system using the ARC's old book Portal database as the system infrastructure, enabling the system to record and store the read-out data. As with image recognition, however, the rate of correct answers as a text mixed with kanji and kana is not high, and at present the system serves only as a "rough draft" and is only practical as a manuscript for proofreading.

Academic Significance and Societal Importance of the Research Achievements

本来日本語で書かれている古典籍や古文書を解読しようというモチベーションは、多くの人が持っており、そうしたモチベーションを活用したSNS型翻刻サイトとして「みんなで翻刻」は、著名なシステムとなっている。一方、オンラインでの翻刻作業を苦手とするが、長年の経験により解読能力が極めて高い人材を、古い文献の解読プロジェクトの協力メンバーとして参加してもらうことで、翻刻効率は大幅に向上できる。コンピュータシステムを使って翻刻本文アーカイブを試みる若手研究者と高い能力を有する高齢者とのコラボレーションを有効に機能させるシステムができたことは大きな意義があろう。

Report

(4 results)
  • 2023 Annual Research Report   Final Research Report ( PDF )
  • 2022 Research-status Report
  • 2021 Research-status Report
  • Research Products

    (5 results)

All 2024 2023 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results) Remarks (2 results)

  • [Journal Article] 自己教師あり学習モデルを用いたくずし字翻刻のための 古文音声認識システムの構築2024

    • Author(s)
      張宇涛, 戸塚史織, 耿毓庭, 岩居健太, 西浦敬信, 赤間 亮
    • Journal Title

      情報処理学会第86回全国大会講演論文集

      Volume: 86 Pages: 1-2

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Presentation] 自己教師あり学習モデルを用いたくずし字翻刻のための古文音声認識システムの構築2024

    • Author(s)
      張宇涛,戸塚史織,耿毓庭,岩居健太,西浦敬信,赤間亮
    • Organizer
      情報処理学会第86回全国大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 古文用音声認識システムの構築とくずし字翻刻の音声入力システム2023

    • Author(s)
      Zhang Yutao、西浦敬信、戸塚史織、赤間亮
    • Organizer
      2022年度「日本文化デジタル・ヒューマニティーズ拠点」プロジェクト成果発表会
    • Related Report
      2022 Research-status Report
  • [Remarks] ARC古典籍ポータルデータベース 全文テキスト検索

    • URL

      https://www.dh-jac.net/db1/books/search3.php?enter=portal&lang=ja

    • Related Report
      2023 Annual Research Report
  • [Remarks] 日本古典籍デジタル研究所:古典籍翻刻プロジェクト

    • URL

      https://www.arc.ritsumei.ac.jp/lib/vm/J-book/A/

    • Related Report
      2021 Research-status Report

URL: 

Published: 2021-07-13   Modified: 2025-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi