• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

近代書籍からの知の再構築

Research Project

Project/Area Number 20H04483
Research InstitutionNara Women's University

Principal Investigator

城 和貴  奈良女子大学, 生活環境科学系, 教授 (90283928)

Co-Investigator(Kenkyū-buntansha) 高田 雅美  奈良女子大学, 生活環境科学系, 講師 (20397574)
石川 由羽  滋賀大学, データサイエンス学系, 助教 (20814370)
Project Period (FY) 2020-04-01 – 2023-03-31
Keywords近代書籍文字認識 / 深層距離学習 / 近代文語体自動翻訳 / CRAFT / 解像度ピラミッド
Outline of Annual Research Achievements

近代書籍文字認識において、これまでに使用してきたCNNに代わって深層距離学習を採用したところ、L2-constrained SoftMaxを使ったものが同じ条件で行ったCNNより優位な認識率を出すことが分かった。この研究成果は令和4年7月に米国ラスベガスで開催された国際会議で発表を行っている。その後、距離学習の中でも基本的なL2-constrained SoftMax以外の手法でFace系(CosFace, ArcFace, SphereFace)を適切に使うことで認識率を更に良くすることが判明し、近代書籍文字認識の基礎研究として、ほぼ完成を見たと言える状態に到達した。
近代文語体と現代口語体の自動翻訳では、前年度の研究を更に進めて、6万対を大幅に超える近代文語体・現代口語体の文を整備した。整備した学習データを用いて、これまでに行ってきたニューロ翻訳の予備実験から本格的な実験に着手したところ、予備実験では最適と思われていたConvSeq2Seqより、データを十分に与えられたTransformerの方が優位に優れていることが判明した。この研究成果も上記国際会議で発表を行っている。
レイアウト解析では、これまでにCRAFTを用いたものが有望であるとの知見を得ていたが、これをマルチカラム・マルチサイズの近代書籍(新聞や帝国議会会議録)に適用する場合、CRAFTの追加学習に必要な膨大な計算資源を確保できないため、ピラミッド解像度を併用した手法を開発し、近代書籍文字認識に対応したNDLOCRやGoogleのVisionAPIよりも文字抽出の精度が良いことを示した。この研究結果は情報処理学会論文誌にて採録決定している。

Research Progress Status

令和4年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和4年度が最終年度であるため、記入しない。

  • Research Products

    (4 results)

All 2023 2022

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results)

  • [Journal Article] 多段組多サイズ見出しで構成される近代書籍のレイアウト解析2023

    • Author(s)
      飯田紗也香,竹本有紀,石川由羽,髙田雅美,城和貴
    • Journal Title

      情報処理学会論文誌数理モデル化と応用

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Application of Deep Metric Learning to Early-modern Japanese Printed Character Recognition2023

    • Author(s)
      1.Norie Koiso, Yuki Takemoto, Sayaka Iida, Yu Ishikawa, Masami Takata, Kazuki Joe
    • Journal Title

      Proceedings of The 2022 International Conference on Parallel and Distributed Processing Techniques and Applications

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Translating Early-modern Written Style into Current Colloquial Style in Hoji Shinbun2023

    • Author(s)
      2.Honoka Nishikawa, Yuki Takemoto, Sayaka Iida, Yu Ishikawa, Masami Takata, Kaoru Ueda, Kazuki Joe
    • Journal Title

      Proceedings of The 2022 International Conference on Parallel and Distributed Processing Techniques and Applications

      Volume: - Pages: -

    • Peer Reviewed
  • [Presentation] 近代書籍文字認識に対応した誤字検出2022

    • Author(s)
      福元春奈, 竹本有紀, 石川由羽, 高田雅美, 城和貴
    • Organizer
      情報処理学会数理モデル化と問題解決研究会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi