2022 年度実績報告書

近代書籍からの知の再構築

研究課題

研究課題/領域番号	20H04483
研究機関	奈良女子大学
研究代表者	城和貴奈良女子大学, 生活環境科学系, 教授 (90283928)
研究分担者	高田雅美奈良女子大学, 生活環境科学系, 講師 (20397574) 石川由羽滋賀大学, データサイエンス学系, 助教 (20814370)
研究期間 (年度)	2020-04-01 – 2023-03-31
キーワード	近代書籍文字認識 / 深層距離学習 / 近代文語体自動翻訳 / CRAFT / 解像度ピラミッド
研究実績の概要	近代書籍文字認識において、これまでに使用してきたCNNに代わって深層距離学習を採用したところ、L2-constrained SoftMaxを使ったものが同じ条件で行ったCNNより優位な認識率を出すことが分かった。この研究成果は令和4年7月に米国ラスベガスで開催された国際会議で発表を行っている。その後、距離学習の中でも基本的なL2-constrained SoftMax以外の手法でFace系（CosFace, ArcFace, SphereFace）を適切に使うことで認識率を更に良くすることが判明し、近代書籍文字認識の基礎研究として、ほぼ完成を見たと言える状態に到達した。近代文語体と現代口語体の自動翻訳では、前年度の研究を更に進めて、6万対を大幅に超える近代文語体・現代口語体の文を整備した。整備した学習データを用いて、これまでに行ってきたニューロ翻訳の予備実験から本格的な実験に着手したところ、予備実験では最適と思われていたConvSeq2Seqより、データを十分に与えられたTransformerの方が優位に優れていることが判明した。この研究成果も上記国際会議で発表を行っている。レイアウト解析では、これまでにCRAFTを用いたものが有望であるとの知見を得ていたが、これをマルチカラム・マルチサイズの近代書籍（新聞や帝国議会会議録）に適用する場合、CRAFTの追加学習に必要な膨大な計算資源を確保できないため、ピラミッド解像度を併用した手法を開発し、近代書籍文字認識に対応したNDLOCRやGoogleのVisionAPIよりも文字抽出の精度が良いことを示した。この研究結果は情報処理学会論文誌にて採録決定している。
現在までの達成度 (段落)	令和4年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和4年度が最終年度であるため、記入しない。

研究成果
(4件)

すべて 2023 2022

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件)

[雑誌論文] 多段組多サイズ見出しで構成される近代書籍のレイアウト解析2023
- 著者名/発表者名
  飯田紗也香，竹本有紀，石川由羽，髙田雅美，城和貴
- 雑誌名
  
  情報処理学会論文誌数理モデル化と応用
  
  巻: - ページ: -
- 査読あり
[雑誌論文] Application of Deep Metric Learning to Early-modern Japanese Printed Character Recognition2023
- 著者名/発表者名
  1.Norie Koiso, Yuki Takemoto, Sayaka Iida, Yu Ishikawa, Masami Takata, Kazuki Joe
- 雑誌名
  
  Proceedings of The 2022 International Conference on Parallel and Distributed Processing Techniques and Applications
  
  巻: - ページ: -
- 査読あり
[雑誌論文] Translating Early-modern Written Style into Current Colloquial Style in Hoji Shinbun2023
- 著者名/発表者名
  2.Honoka Nishikawa, Yuki Takemoto, Sayaka Iida, Yu Ishikawa, Masami Takata, Kaoru Ueda, Kazuki Joe
- 雑誌名
  
  Proceedings of The 2022 International Conference on Parallel and Distributed Processing Techniques and Applications
  
  巻: - ページ: -
- 査読あり
[学会発表] 近代書籍文字認識に対応した誤字検出2022
- 著者名/発表者名
  福元春奈, 竹本有紀, 石川由羽, 高田雅美, 城和貴
- 学会等名
  情報処理学会数理モデル化と問題解決研究会

2022 年度 実績報告書

近代書籍からの知の再構築

研究代表者

城 和貴 奈良女子大学, 生活環境科学系, 教授 (90283928)

研究成果

[雑誌論文] 多段組多サイズ見出しで構成される近代書籍のレイアウト解析2023

著者名/発表者名

雑誌名

[雑誌論文] Application of Deep Metric Learning to Early-modern Japanese Printed Character Recognition2023

著者名/発表者名

雑誌名

[雑誌論文] Translating Early-modern Written Style into Current Colloquial Style in Hoji Shinbun2023

著者名/発表者名

雑誌名

[学会発表] 近代書籍文字認識に対応した誤字検出2022

著者名/発表者名

学会等名

2022 年度実績報告書

城和貴奈良女子大学, 生活環境科学系, 教授 (90283928)