手書き文字認識問題を対象とした深層学習における入力パターン内論理構造の自己組織化
Project/Area Number |
19K12045
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Oita University |
Principal Investigator |
行天 啓二 大分大学, 理工学部, 准教授 (80305028)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2021: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
Fiscal Year 2020: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2019: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
|
Keywords | 深層学習 / 文字認識 / 枝刈り / 物体検出 / 手書き文字認識 / 線画生成 / 特徴可視化 / データ拡張 / 文字ストローク認識 / 文字構造モデル / 論理構造 |
Outline of Research at the Start |
近年盛んに研究されている深層学習に基づくニューラルネットワークにおいて,学習時に用いられる入力データに内在する論理構造を自動的に獲得することができないかについて検証する.具体的には,手書き文字認識問題を対象にして,入力データである文字画像から,各文字種たらしめる固有の構造,すなわち,文字内の偏旁やストローク構造を,論理構造として自動的に把握することができないかについて検証する.
|
Outline of Annual Research Achievements |
2023年度は,交付申請書で設定した研究計画のうち、(5)入力パターンに内在する論理構造の自己組織化の可能性検証に則して、2022年度に確立した手法に関する実験及び手法改良を実施した。さらに,それらの成果を国際会議において対外的に発表した。 研究期間全体を通じ,研究目的である入力パターンに内在する論理構造獲得の可能性について,以下に示すトップダウン的なアプローチと、ボトムアップ的なアプローチについて検証した。 トップダウン的アプローチは、深層学習に基づくニューラルネットワークを使用し、文字認識問題における入力パターンの論理構造を把握することを目指した。具体的には、ニューラルネットワーク内でエッジ刈り込みにより単純なパターンに反応する検出器を獲得し、それらを接続して木構造として表現することで、文字認識を実現した。このアプローチは、入力パターンに内在する論理構造を明確化し、判断の根拠を説明可能にした。 一方、ボトムアップ的アプローチは、活字漢字の認識において、学習過程で認識対象の構造を把握し、その構造に基づいた認識を実現することを目指した。物体検出やインスタンスセグメンテーションを活用して文字の内部構造を理解し、誤認識の原因を解明することで、判断の根拠を示す技術を確立した。このアプローチは、認識対象の構造に着目し、その構造を利用して認識を行うことで、判断の理由を明確にすることを目指した。 両方のアプローチは、深層学習による文字認識において、単なる入力パターンの識別にとどまらず、入力パターンに内在する論理構造を理解し、判断の根拠を説明可能にする可能性を示唆するものである。
|
Report
(5 results)
Research Products
(12 results)