研究課題/領域番号 |
19K12045
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 大分大学 |
研究代表者 |
行天 啓二 大分大学, 理工学部, 准教授 (80305028)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
|
キーワード | 深層学習 / 文字認識 / 線画生成 / 文字ストローク認識 / 物体検出 / 枝刈り / 手書き文字認識 / 特徴可視化 / データ拡張 / 文字構造モデル / 論理構造 |
研究開始時の研究の概要 |
近年盛んに研究されている深層学習に基づくニューラルネットワークにおいて,学習時に用いられる入力データに内在する論理構造を自動的に獲得することができないかについて検証する.具体的には,手書き文字認識問題を対象にして,入力データである文字画像から,各文字種たらしめる固有の構造,すなわち,文字内の偏旁やストローク構造を,論理構造として自動的に把握することができないかについて検証する.
|
研究成果の概要 |
本研究は,手書き文字認識における論理構造理解を目的として進められた。具体的には,文字のストロークの構造を制御し,ニューラルネットワークがどの程度その構造を理解しているかを解析することを目指した。線画自動生成手法を用いて文字認識データの拡張を試み,ストロークレベルでの認識精度向上と誤認識原因の特定を行った。また,文字の構成要素をボトムアップおよびトップダウンの両アプローチで解析する手法についても検討した。その結果,認識精度と説明可能性の向上に成功したが,認識率や自然な手書き文字画像生成において課題が残った。今後は汎用性の検証や定量的評価手法の開発が必要である。
|
研究成果の学術的意義や社会的意義 |
本研究は,手書き文字認識における論理構造理解を目指し,文字のストローク構造を制御してニューラルネットワークがその構造をどの程度理解できるかを解析した。また,文字内の部分構造を,ボトムアップ的またはトップダウン的に獲得することができることを示した。これにより,深層学習技術の「ブラックボックス」問題を部分的に解決し,識別結果の説明可能性を向上させたことが学術的意義として挙げられる。社会的意義としては,認識精度と説明可能性を両立させ,深層学習技術の信頼性を高めることに寄与したと考える。また,線画自動生成手法の応用によるデータ拡張の可能性も示すことができたと考える。
|