2020 Fiscal Year Annual Research Report
Research on practical Japanese handwritten character recognition method for application to deep learning
Project/Area Number |
20K11868
|
Research Institution | Kagoshima University |
Principal Investigator |
朱 碧蘭 鹿児島大学, 理工学域工学系, 准教授 (50466918)
|
Project Period (FY) |
2020-04-01 – 2021-03-31
|
Keywords | 手書き認識 / オンライン認識 / 確率モデル |
Outline of Annual Research Achievements |
日本語のオンライン手書認識においては,続け字と草書体の手書きにおける誤認識が課題として残っている.Deep Learning手法は近年注目を浴びていて,各分野で最高精度を達成している. Deep Learningによる英語手書き認識も最高精度を達成したが,日本語手書き文字ではDeep Learningを利用したシステムは字種数を約3000文字に限定して,実用的なレベルまで達していない. Deep Learningネットワークの規模限定により4000個以下のクラスター認識が適切であると思われる.大規模な認識による膨大なネットワークの計算においては,コンピュータの計算能力を超える問題と学習データ不足による精度低下の問題がある.7000個以上の字種を含んだ常用日本語文字認識において,Deep Learningによるものはまだ実現されていない. 申請者は漢字間で部首モデルを共有するMarkov Random Field による日本語文字認識方式に成功していた.この知見を活かし,本研究は数百個の部首などの文字属性を識別するDeep Learningシステムを構築することにより,数万個の日本語文字認識を行う手法を提案し,認識精度低下の既存問題を解決する.Deep Learningへの適用を目指した実用的なオンライン日本語手書き文字認識システムを実現する.既存の文字認識手法と最先端の機械学習手法を融合し,欠点を補う統一的な認識モデルを確立する. 本学と中国科学院自動化研究所とニューヨーク州立大学バッファロー校でそれぞれ作成された大規模データベースなどを利用し,既存手法との比較・検討の上に,PDCAサイクルを回して標記の目標を追及した.国際会議や論文誌などの場で研究成果を公表するとともに,研究に必要な意見交換を行った.
|