研究課題/領域番号 |
19K12045
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 大分大学 |
研究代表者 |
行天 啓二 大分大学, 理工学部, 准教授 (80305028)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
|
キーワード | 深層学習 / 文字認識 / 枝刈り / 物体検出 / 手書き文字認識 / 線画生成 / 特徴可視化 / データ拡張 / 文字ストローク認識 / 文字構造モデル / 論理構造 |
研究開始時の研究の概要 |
近年盛んに研究されている深層学習に基づくニューラルネットワークにおいて,学習時に用いられる入力データに内在する論理構造を自動的に獲得することができないかについて検証する.具体的には,手書き文字認識問題を対象にして,入力データである文字画像から,各文字種たらしめる固有の構造,すなわち,文字内の偏旁やストローク構造を,論理構造として自動的に把握することができないかについて検証する.
|
研究実績の概要 |
2023年度は,交付申請書で設定した研究計画のうち、(5)入力パターンに内在する論理構造の自己組織化の可能性検証に則して、2022年度に確立した手法に関する実験及び手法改良を実施した。さらに,それらの成果を国際会議において対外的に発表した。 研究期間全体を通じ,研究目的である入力パターンに内在する論理構造獲得の可能性について,以下に示すトップダウン的なアプローチと、ボトムアップ的なアプローチについて検証した。 トップダウン的アプローチは、深層学習に基づくニューラルネットワークを使用し、文字認識問題における入力パターンの論理構造を把握することを目指した。具体的には、ニューラルネットワーク内でエッジ刈り込みにより単純なパターンに反応する検出器を獲得し、それらを接続して木構造として表現することで、文字認識を実現した。このアプローチは、入力パターンに内在する論理構造を明確化し、判断の根拠を説明可能にした。 一方、ボトムアップ的アプローチは、活字漢字の認識において、学習過程で認識対象の構造を把握し、その構造に基づいた認識を実現することを目指した。物体検出やインスタンスセグメンテーションを活用して文字の内部構造を理解し、誤認識の原因を解明することで、判断の根拠を示す技術を確立した。このアプローチは、認識対象の構造に着目し、その構造を利用して認識を行うことで、判断の理由を明確にすることを目指した。 両方のアプローチは、深層学習による文字認識において、単なる入力パターンの識別にとどまらず、入力パターンに内在する論理構造を理解し、判断の根拠を説明可能にする可能性を示唆するものである。
|