• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

古文書解読熟練者の研究行為から抽出する音声認識電子テキストアーカイブ

研究課題

研究課題/領域番号 21K18372
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分2:文学、言語学およびその関連分野
研究機関立命館大学

研究代表者

赤間 亮  立命館大学, 文学部, 教授 (70212412)

研究分担者 西浦 敬信  立命館大学, 情報理工学部, 教授 (70343275)
山路 正憲  立命館大学, 衣笠総合研究機構, 研究員 (00899049)
研究期間 (年度) 2021-07-09 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード形態素解析 / UNIDIC / 古典籍 / 古文書 / 翻刻 / 翻刻支援 / 変体仮名 / 音声入力 / 自動変換 / 形態解析
研究開始時の研究の概要

歴史的典籍・古文書の翻刻デジタルアーカイブを進める上で、AI画像認識を使った自動翻刻技術が進展しているが、その正答率はいまだ十分ではなく、100%正確なテキストアーカイブが課題となってきている。本研究では、その一つの方策として、熟練者の解読能力を活用し、かつ熟練者の負担を出来る限り軽減して翻刻テキストを作成するため、熟練者の読上げ音声を、読み上げ時の本文テキスト情報以外のノイズを極力軽減して、電子テキスト化し、立命館ARCの初心者の育成・教育ができる「翻刻支援システム」とを連携させ、ツールの一つとしてシステムに加え、従来の翻刻量を圧倒的に凌駕するシステムを開発する。

研究成果の概要

歴史的典籍・古文書の翻刻デジタルアーカイブを進める上で、AI画像認識を使った自動翻刻技術が進展している一方、古文書解読の能力を持つ人材は、高齢者が多く、キーボード入力が苦手な場合が多い。本研究では、解読能力を持つ人材に文書を読み上げてもらい、その音声により翻刻本文の「原稿」を記録するシステムの開発を行った。立命館大学ARCの古典籍ポータルをシステム基盤として、システムを組み込み、読み上げデータの記録保存が可能にすることができた。一方、画像認識と同様に、漢字仮名交じり本文としての正解率は、高くなく、現状では「粗稿」としての役割となっており、校正用原稿としての実用性にとどまる。

研究成果の学術的意義や社会的意義

本来日本語で書かれている古典籍や古文書を解読しようというモチベーションは、多くの人が持っており、そうしたモチベーションを活用したSNS型翻刻サイトとして「みんなで翻刻」は、著名なシステムとなっている。一方、オンラインでの翻刻作業を苦手とするが、長年の経験により解読能力が極めて高い人材を、古い文献の解読プロジェクトの協力メンバーとして参加してもらうことで、翻刻効率は大幅に向上できる。コンピュータシステムを使って翻刻本文アーカイブを試みる若手研究者と高い能力を有する高齢者とのコラボレーションを有効に機能させるシステムができたことは大きな意義があろう。

報告書

(4件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (5件)

すべて 2024 2023 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) 備考 (2件)

  • [雑誌論文] 自己教師あり学習モデルを用いたくずし字翻刻のための 古文音声認識システムの構築2024

    • 著者名/発表者名
      張宇涛, 戸塚史織, 耿毓庭, 岩居健太, 西浦敬信, 赤間 亮
    • 雑誌名

      情報処理学会第86回全国大会講演論文集

      巻: 86 ページ: 1-2

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [学会発表] 自己教師あり学習モデルを用いたくずし字翻刻のための古文音声認識システムの構築2024

    • 著者名/発表者名
      張宇涛,戸塚史織,耿毓庭,岩居健太,西浦敬信,赤間亮
    • 学会等名
      情報処理学会第86回全国大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 古文用音声認識システムの構築とくずし字翻刻の音声入力システム2023

    • 著者名/発表者名
      Zhang Yutao、西浦敬信、戸塚史織、赤間亮
    • 学会等名
      2022年度「日本文化デジタル・ヒューマニティーズ拠点」プロジェクト成果発表会
    • 関連する報告書
      2022 実施状況報告書
  • [備考] ARC古典籍ポータルデータベース 全文テキスト検索

    • URL

      https://www.dh-jac.net/db1/books/search3.php?enter=portal&lang=ja

    • 関連する報告書
      2023 実績報告書
  • [備考] 日本古典籍デジタル研究所:古典籍翻刻プロジェクト

    • URL

      https://www.arc.ritsumei.ac.jp/lib/vm/J-book/A/

    • 関連する報告書
      2021 実施状況報告書

URL: 

公開日: 2021-07-13   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi