2022 Fiscal Year Annual Research Report
Text Recognition of Historical Japanese Documents
Project/Area Number |
18K19800
|
Research Institution | Gunma University |
Principal Investigator |
長井 歩 群馬大学, 大学院理工学府, 助教 (70375567)
|
Project Period (FY) |
2018-06-29 – 2023-03-31
|
Keywords | 崩し字 / 文字認識 / 深層学習 / 翻刻 / 言語モデル |
Outline of Annual Research Achievements |
【最終年度に実施した研究の成果】入力行画像の幅を32ビットから64ビットに拡張したCRNNを実装し,くずし字の認識精度を向上させた.この成果を利用すると,32ビットのCRNNを下敷きに積み上げたすべての研究成果を塗り直すことが可能である. 【研究期間全体を通じて実施した研究の成果】既に行単位に分割された崩し字の文字列の画像を入力として,テキストの文字列を出力する深層学習のシステムを開発した.このシステムは,申請者が知る限り最高の認識性能を達成した.出現頻度の少ない文字の学習効率を上げるために様々な工夫を行った.この成果は国際会議ICDAR2019にて発表した. 行単位に分割された崩し字画像の認識精度を更に高めた.乱数の種を変えて訓練した学習器が出力した複数のテキスト候補と言語モデルを組み合わせて最も自然なテキストを出力し,そのテキストを正解文字列と仮定して次の訓練に利用するサイクルを繰り返しによって正解率を最大10%程度向上させた.更にこの学習器をページ画像認識にも応用した.この成果は国際会議ICFHR2020にて発表するとともに,3文字の文字列認識を課題としたPRMUアルコンで41チーム中2位,ページ単位の認識を課題としたKaggleのコンテストで293チーム中6位となった. 版本(出版された本)ではない肉筆の文書の崩し字の中には、版本よりも読みにくい文字がたくさんあり,肉筆のくずし字認識には今まで以上の工夫が必要である.そこで肉筆のくずし字のページ画像と対応するページ単位の翻刻テキストを入力として与えると,くずし字の行画像とその翻刻テキストのペアを出力するような学習システムを開発した.これは肉筆のくずし字だけから成る一定以上の規模のデータとしては初めてのものである.更に,このくずし字データを従来の公開データと共に別途学習に使うと,従来に比べ4.5%程度正解率が向上した.
|