2022 Fiscal Year Research-status Report
手書き文字認識問題を対象とした深層学習における入力パターン内論理構造の自己組織化
Project/Area Number |
19K12045
|
Research Institution | Oita University |
Principal Investigator |
行天 啓二 大分大学, 理工学部, 講師 (80305028)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 深層学習 / 文字認識 / 枝刈り / 物体検出 |
Outline of Annual Research Achievements |
2022年度は、交付申請書で設定した研究計画のうち、(5)入力パターンに内在する論理構造の自己組織化の可能性検証に則して、研究を遂行した。具体的には、論理構造の自己組織化方法について、以下に示すトップダウン的なアプローチと、ボトムアップ的なアプローチについて検証した。 トップダウン的なアプローチでは、手書き文字認識用ニューラルネットワークの学習の過程で、重みがほぼ無いエッジを枝刈りしていくことにより、似た構造を持つ文字画像に反応するノードを獲得することができることを確認した。さらに、これらのノードを文字画像内の共通構造を獲得する弱識別器と捉え、弱識別器を逐次的に追加していくことにより文字内の共通構造を獲得し、さらに、残存エッジの接続関係から、共通構造の階層関係を獲得することができることを確認した。 ボトムアップ的なアプローチでは、活字文字認識問題を対象にして、単純な文字群が複雑な文字群のどの位置に存在するかを、物体検出用ニューラルネットワークを用いて把握させることを試みた。さらに、これらの物体検出結果を概観し、単純な文字と複雑な文字の間の部分全体関係を考慮した文字認識の実現可能性について検証した。結果として、複雑な文字に内在する単純な文字の位置把握についてある程度の性能を確認することはできたものの、そこまで信頼性は高くはなく、様々な文字間の部分全体関係を明確に獲得するにはさらなる工夫が必要であることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
「研究実績の概要」で示したアプローチのうち、トップダウン的に手書き文字画像内の共通構造を獲得し、それらの階層関係を獲得する手法については、実装は終了している。また、簡単な手書き文字画像を対象にした実験も終了している。しかしながら、本研究を論文に投稿した際、その査読結果において以下の問題点が指摘された。一つ目は、本手法が、手書き文字認識だけではなく、パターン認識の分野におけるどのような技術的課題に貢献するかについて不明確であるという点である。本研究の本来の目的は、手書き文字認識問題をテストケースとして、認識対象に内在する構造的パターンに基づいた判断根拠の説明を実現することであった。しかしながら、認識対象に内在する共通パターンの階層構造を獲得することはできたものの、それが、判断根拠の説明にどのように役立つのかの実証が不十分であるという指摘である。二つ目は、本手法の有効性を示すための実験が不十分であるという点である。手書き文字認識問題において、もっと字種を増やす必要があること、また、他のパターン認識問題についても本手法を適用しなければ、その有効性を実証したことにはならないという指摘である。以上より、手法はほぼ確立しているものの、提案手法の有効性の説明や実験が不十分であるという進捗状況である。 ボトムアップ的なアプローチにより、活字文字から単純な文字と複雑な文字の間の部分全体関係を考慮した文字認識を実現する研究については、上記トップダウン的アプローチから派生した研究であり、交付申請書では言及していなかった。まだ研究を開始したばかりの段階であり、今後、様々な検討を経て手法を確立してくという進捗状況である。
|
Strategy for Future Research Activity |
トップダウン的に手書き文字画像内の共通構造を獲得し、それらの階層関係を獲得する手法については、本手法により得られる認識対象に内在する構造的パターンに基づいた判断根拠の説明が可能である点を、実験を通じて実証する。具体的には、本手法により得られる文字画像内の共通構造を獲得する弱識別器の活性化状況を数量的に示し、弱識別器の接続関係と共に提示することより、当初の目的であった判断根拠の説明を実現する。また、扱う文字の種類を増やし、より複雑な認識対象に内在する構造的パターンについても扱うことができる点について、実験を通じて示す。さらに、手書き文字認識問題だけではなく、物体認識問題に対しても本手法を適用し、このアプローチが、様々なパターン認識問題に対して適用可能かについて確認し、本研究の今後の方向性を明らかにすることを目指す。 ボトムアップ的なアプローチにより、活字文字から単純な文字と複雑な文字の間の部分全体関係を考慮した文字認識を実現する研究については、今後、複雑な文字内に内在する単純な文字の分布の表現方法を検討する。さらに、地理空間データ分析に代表される様々な空間データ分析手法を適用することにより、文字認識を実現することができるかについて検討する。 これらの検討を通じ、上記トップダウン的手法およびボトムアップ的手法を統合し、本研究の目的であった、深層学習における入力パターンに内在する論理構造の自己組織化がどこまで実現可能かについて総括する。
|
Causes of Carryover |
研究成果について国際会議で発表することができず、旅費および学会参加費について残額が生じたため。 次年度は、国際会議における発表を目指し、その際の旅費および学会参加費として使用する計画である。
|
Research Products
(1 results)