• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

データ合成と深層学習を用いた歴史的文書の画像解析手法 ー行抽出と行の順序付けー

研究課題

研究課題/領域番号 22K12736
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関芝浦工業大学

研究代表者

鈴木 徹也  芝浦工業大学, システム理工学部, 教授 (00323824)

研究期間 (年度) 2022-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2023年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
キーワード文書画像解析 / 歴史的文書 / データ合成 / 深層学習
研究開始時の研究の概要

計算機による歴史的文書(古典籍、古文書など)の翻刻支援の研究では、文書画像中の文字の位置検出と文字のパターン認識とについての研究は進んでいる。しかし検出した各文字の読み順の決定法についてはあまり進んでいない。文字の位置検出に加えて、行の抽出と抽出した行の読み順の決定(順序付)ができれば、検出した文字の読み順が決定できると考えられる。
本研究課題では、深層学習を利用した古典籍の文書画像解析手法(行の抽出法、行の順序付け法)を考案および実装した上で評価する。また、深層学習に必要な学習データの合成法についても考案および実装した上で評価する。

研究実績の概要

計算機による歴史的文書(古典籍、古文書など)の翻刻支援の研究では、文書画像中の文字の位置検出と文字のパターン認識とについての研究は進んでいる。しかし検出した各文字の読み順の決定法についてはあまり進んでいない。文字の位置検出に加えて、行の抽出と抽出した行の読み順の決定(順序付)ができれば、検出した文字の読み順が決定できると考えられる。このような背景から本研究は次の2つを目的とする。(1)古典籍を対象とした文書画像解析(行抽出、行の順序付)に利用する深層ニューラルネットワークの構成を提案し、その評価を行うこと。(2)深層ニューラルネットワークのための学習データの合成法を提案し、その評価を行うこと。

2023年度はセマンティックセグメンテーションによる古典籍文書画像からの行抽出法の評価を行った。対象とする古典籍に似せた古典籍画像とその行中心線画像とを大量に生成した。それを学習データとして、セマンティックセグメンテーションモデルを訓練・検証およびテストした。合成文書画像でのIoUの平均値は97.6%であった。同じように学習したモデルを実際の古典籍画像に適用したところ、定量的な評価には至らなかったが、概ね良好な結果を得ることができた。その研究成果[1]をパターン認識に関する国際会議ICPRAM2024で発表した。

参考文献
[1] Sayaka Mori, Tetsuya Suzuki: Experimental Application of Semantic Segmentation Models Fine-Tuned with Synthesized Document Images to Text Line Segmentation in a Handwritten Japanese Historical Document. ICPRAM 2024: 826-832.

現在までの達成度 (区分)
現在までの達成度 (区分)

4: 遅れている

理由

初年度(2022年度)に研究代表者の家庭の事情により研究に費やす時間を十分に確保できなかった。

今後の研究の推進方策

2023年度に提案したセマンティックセグメンテーションによる行抽出法の改善と抽出行の読み順決定法の開発と行う予定である。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (1件)

すべて 2024

すべて 学会発表 (1件) (うち国際学会 1件)

  • [学会発表] Experimental Application of Semantic Segmentation Models Fine-Tuned with Synthesized Document Images to Text Line Segmentation in a Handwritten Japanese Historical Document2024

    • 著者名/発表者名
      Mori Sayaka、Suzuki Tetsuya
    • 学会等名
      13th International Conference on Pattern Recognition Applications and Methods
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi