研究実績の概要 |
近代書籍の文字画像1,085種を用意し、このうち869種の近代書籍の文字画像と現代のフォントの文字画像からフォント変換を学習して、近代書籍文字の特徴を持つフォントを自動生成した。全1,085種の自動生成フォントを学習データ、フォント変換の学習に用いた869種の近代書籍文字画像を検証データとしてCNNに学習させたところ、フォント変換の学習に用いていない216種の近代書籍文字画像の認識率が98%を超える結果が得られた。また、フォント変換を学習するネットワークのパラメータを変化させると、現代のフォントの文字画像1種類から、特徴が少しずつ異なる様々なフォントを生成可能である。これにより、学習データの不足が課題である近代書籍文字認識に対して、大量の学習データを用意することができる。複数の自動生成フォントを組み合わせて学習させた実験では、後述の文字骨格修正を行うことで、すべての識別器で誤認識する文字が存在しなくなる。複数の識別器を組み合わせてアンサンブル学習を行えば、さらなる認識精度の向上が見込まれる。 フォント変換の学習に用いたネットワークでは、現代のフォントと近代書籍文字で点や線の向きが大きく異なる場合に、その特徴を変化させたフォントを生成することはできない。そのため、現代のフォントと近代書籍文字で文字骨格が大きく異なる文字で誤認識が多く発生する。しかし、現代のフォントの文字画像に対して修正を行い、近代書籍文字と類似した文字骨格の文字画像を作成することで、誤認識が多発する文字が正しく認識できるようになり、認識精度が向上することがわかった。文字骨格を修正したことで別の文字と誤認識する場合も確認されるが、これは学習後の各文字の特徴分布を調整して認識精度を向上させる深層距離学習を導入することで、認識精度が向上すると考えられる。 これらの研究成果について国内の研究会で発表を行った。
|