• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

近代書籍からの知の再構築

研究課題

研究課題/領域番号 20H04483
研究機関奈良女子大学

研究代表者

城 和貴  奈良女子大学, 生活環境科学系, 教授 (90283928)

研究分担者 高田 雅美  奈良女子大学, 生活環境科学系, 講師 (20397574)
石川 由羽  滋賀大学, データサイエンス学系, 助教 (20814370)
研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード近代書籍文字認識 / 深層距離学習 / 近代文語体自動翻訳 / CRAFT / 解像度ピラミッド
研究実績の概要

近代書籍文字認識において、これまでに使用してきたCNNに代わって深層距離学習を採用したところ、L2-constrained SoftMaxを使ったものが同じ条件で行ったCNNより優位な認識率を出すことが分かった。この研究成果は令和4年7月に米国ラスベガスで開催された国際会議で発表を行っている。その後、距離学習の中でも基本的なL2-constrained SoftMax以外の手法でFace系(CosFace, ArcFace, SphereFace)を適切に使うことで認識率を更に良くすることが判明し、近代書籍文字認識の基礎研究として、ほぼ完成を見たと言える状態に到達した。
近代文語体と現代口語体の自動翻訳では、前年度の研究を更に進めて、6万対を大幅に超える近代文語体・現代口語体の文を整備した。整備した学習データを用いて、これまでに行ってきたニューロ翻訳の予備実験から本格的な実験に着手したところ、予備実験では最適と思われていたConvSeq2Seqより、データを十分に与えられたTransformerの方が優位に優れていることが判明した。この研究成果も上記国際会議で発表を行っている。
レイアウト解析では、これまでにCRAFTを用いたものが有望であるとの知見を得ていたが、これをマルチカラム・マルチサイズの近代書籍(新聞や帝国議会会議録)に適用する場合、CRAFTの追加学習に必要な膨大な計算資源を確保できないため、ピラミッド解像度を併用した手法を開発し、近代書籍文字認識に対応したNDLOCRやGoogleのVisionAPIよりも文字抽出の精度が良いことを示した。この研究結果は情報処理学会論文誌にて採録決定している。

現在までの達成度 (段落)

令和4年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和4年度が最終年度であるため、記入しない。

  • 研究成果

    (4件)

すべて 2023 2022

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件)

  • [雑誌論文] 多段組多サイズ見出しで構成される近代書籍のレイアウト解析2023

    • 著者名/発表者名
      飯田紗也香,竹本有紀,石川由羽,髙田雅美,城和貴
    • 雑誌名

      情報処理学会論文誌数理モデル化と応用

      巻: - ページ: -

    • 査読あり
  • [雑誌論文] Application of Deep Metric Learning to Early-modern Japanese Printed Character Recognition2023

    • 著者名/発表者名
      1.Norie Koiso, Yuki Takemoto, Sayaka Iida, Yu Ishikawa, Masami Takata, Kazuki Joe
    • 雑誌名

      Proceedings of The 2022 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: - ページ: -

    • 査読あり
  • [雑誌論文] Translating Early-modern Written Style into Current Colloquial Style in Hoji Shinbun2023

    • 著者名/発表者名
      2.Honoka Nishikawa, Yuki Takemoto, Sayaka Iida, Yu Ishikawa, Masami Takata, Kaoru Ueda, Kazuki Joe
    • 雑誌名

      Proceedings of The 2022 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: - ページ: -

    • 査読あり
  • [学会発表] 近代書籍文字認識に対応した誤字検出2022

    • 著者名/発表者名
      福元春奈, 竹本有紀, 石川由羽, 高田雅美, 城和貴
    • 学会等名
      情報処理学会数理モデル化と問題解決研究会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi