手書き文字認識問題を対象とした深層学習における入力パターン内論理構造の自己組織化

研究課題

研究課題/領域番号	19K12045
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	大分大学
研究代表者	行天啓二大分大学, 理工学部, 准教授 (80305028)
研究期間 (年度)	2019-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	1,820千円 (直接経費: 1,400千円、間接経費: 420千円) 2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円) 2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円) 2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2019年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワード	深層学習 / 文字認識 / 線画生成 / 文字ストローク認識 / 物体検出 / 枝刈り / 手書き文字認識 / 特徴可視化 / データ拡張 / 文字構造モデル / 論理構造
研究開始時の研究の概要	近年盛んに研究されている深層学習に基づくニューラルネットワークにおいて，学習時に用いられる入力データに内在する論理構造を自動的に獲得することができないかについて検証する．具体的には，手書き文字認識問題を対象にして，入力データである文字画像から，各文字種たらしめる固有の構造，すなわち，文字内の偏旁やストローク構造を，論理構造として自動的に把握することができないかについて検証する．
研究成果の概要	本研究は，手書き文字認識における論理構造理解を目的として進められた。具体的には，文字のストロークの構造を制御し，ニューラルネットワークがどの程度その構造を理解しているかを解析することを目指した。線画自動生成手法を用いて文字認識データの拡張を試み，ストロークレベルでの認識精度向上と誤認識原因の特定を行った。また，文字の構成要素をボトムアップおよびトップダウンの両アプローチで解析する手法についても検討した。その結果，認識精度と説明可能性の向上に成功したが，認識率や自然な手書き文字画像生成において課題が残った。今後は汎用性の検証や定量的評価手法の開発が必要である。
研究成果の学術的意義や社会的意義	本研究は，手書き文字認識における論理構造理解を目指し，文字のストローク構造を制御してニューラルネットワークがその構造をどの程度理解できるかを解析した。また，文字内の部分構造を，ボトムアップ的またはトップダウン的に獲得することができることを示した。これにより，深層学習技術の「ブラックボックス」問題を部分的に解決し，識別結果の説明可能性を向上させたことが学術的意義として挙げられる。社会的意義としては，認識精度と説明可能性を両立させ，深層学習技術の信頼性を高めることに寄与したと考える。また，線画自動生成手法の応用によるデータ拡張の可能性も示すことができたと考える。

報告書

(6件)

研究成果
(12件)

すべて 2023 2022 2021 2020

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (10件) (うち国際学会 4件)

[雑誌論文] Character Structure Analysis by Adding and Pruning Neural Networks in Handwritten Kanji Recognition2023
- 著者名/発表者名
  Gyohten Keiji、Ohki Hidehiro、Takami Toshiya
- 雑誌名
  
  Pattern Recognition. ACPR 2023. Lecture Notes in Computer Science
  
  巻: 14407 ページ: 129-142
- DOI
  10.1007/978-3-031-47637-2_10
- ISBN
  9783031476365, 9783031476372
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Webページデザイン画像からのHTMLの自動生成における注意機構の拡張2020
- 著者名/発表者名
  知念大貴, 大城英裕, 行天啓二, 高見利也
- 雑誌名
  
  電気学会論文誌Ｃ（電子・情報・システム部門誌）
  
  巻: 140 号: 12 ページ: 1393-1401
- DOI
  10.1541/ieejeiss.140.1393
- NAID
  130007948686
- ISSN
  0385-4221, 1348-8155
- 年月日
  2020-12-01
- 関連する報告書
  2020 実施状況報告書
- 査読あり
[学会発表] 物体検出を用いた漢字の構造把握2022
- 著者名/発表者名
  滋野友哉，行天啓二，大城英裕，高見利也
- 学会等名
  第75回電気・情報関係学会九州支部連合大会
- 関連する報告書
  2022 実施状況報告書
[学会発表] Automatic Characteristic Line Drawing Generation using Pix2pix2022
- 著者名/発表者名
  Kazuki Yanagida, Keiji Gyohten, Hidehiro Ohki and Toshiya Takami
- 学会等名
  The 11th International Conference on Pattern Recognition Applications and Methods (ICPRAM2022)
- 関連する報告書
  2021 実施状況報告書
- 国際学会
[学会発表] pix2pixを用いた線画生成における特徴的な線の自動描画に関する研究2021
- 著者名/発表者名
  柳田一樹，行天啓二, 大城英裕, 高見利也
- 学会等名
  火の国情報シンポジウム2021
- 関連する報告書
  2020 実施状況報告書
[学会発表] Arrhythmia Detection Based on Patient-Specific Normal ECGs Using Deep Learning2020
- 著者名/発表者名
  Shota Hori, Toru Shouo, Keiji Gyohten, Hidehiro Ohki, Toshiya Takami and Noboru Sato
- 学会等名
  2020 Computing in Cardiology (CinC2020)
- 関連する報告書
  2020 実施状況報告書
- 国際学会
[学会発表] Building Normal ECG Models to Detect Any Arrhythmias Using Deep Learning2020
- 著者名/発表者名
  Keiji Gyohten, Shota Hori, Hidehiro Ohki, Toshiya Takami and Noboru Sato
- 学会等名
  2020 Computing in Cardiology (CinC2020)
- 関連する報告書
  2020 実施状況報告書
- 国際学会
[学会発表] ショートカット構造を用いたHTML自動生成の精度向上に関する考察2020
- 著者名/発表者名
  小寺駿，大城英裕，行天啓二，高見利也
- 学会等名
  第25回知能メカトロニクスワークショップ
- 関連する報告書
  2020 実施状況報告書
[学会発表] 心電図における深層学習を用いた正常・異常区間検出の考察2020
- 著者名/発表者名
  中村拳也，大城英裕，行天啓二，高見利也
- 学会等名
  第25回知能メカトロニクスワークショップ
- 関連する報告書
  2020 実施状況報告書
[学会発表] 農作物検査データにおける教師なし・教師あり繰り返し学習によるアノテーション軽減化に関する考察2020
- 著者名/発表者名
  松田千輝，大城英裕，行天啓二，高見利也
- 学会等名
  第25回知能メカトロニクスワークショップ
- 関連する報告書
  2020 実施状況報告書
[学会発表] pix2pixを用いた線画生成における特徴的な線の自動描画に関する研究2020
- 著者名/発表者名
  柳田一樹，行天啓二，大城英裕，高見利也
- 学会等名
  第73回電気・情報関係学会九州支部連合大会
- 関連する報告書
  2020 実施状況報告書
[学会発表] A Method to Identify the Cause of Misrecognition for Offline Handwritten Japanese Character Recognition using Deep Learning2020
- 著者名/発表者名
  Keiji Gyohten
- 学会等名
  9th International Conference on Pattern Recognition Applications and Methods(ICPRAM2020)
- 関連する報告書
  2019 実施状況報告書
- 国際学会

手書き文字認識問題を対象とした深層学習における入力パターン内論理構造の自己組織化

研究代表者

行天 啓二 大分大学, 理工学部, 准教授 (80305028)

1,820千円 (直接経費: 1,400千円、間接経費: 420千円)

報告書

研究成果

[雑誌論文] Character Structure Analysis by Adding and Pruning Neural Networks in Handwritten Kanji Recognition2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Webページデザイン画像からのHTMLの自動生成における注意機構の拡張2020

著者名/発表者名

雑誌名

DOI

NAID

ISSN

年月日

関連する報告書

[学会発表] 物体検出を用いた漢字の構造把握2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Automatic Characteristic Line Drawing Generation using Pix2pix2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] pix2pixを用いた線画生成における特徴的な線の自動描画に関する研究2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Arrhythmia Detection Based on Patient-Specific Normal ECGs Using Deep Learning2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Building Normal ECG Models to Detect Any Arrhythmias Using Deep Learning2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] ショートカット構造を用いたHTML自動生成の精度向上に関する考察2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] 心電図における深層学習を用いた正常・異常区間検出の考察2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] 農作物検査データにおける教師なし・教師あり繰り返し学習によるアノテーション軽減化に関する考察2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] pix2pixを用いた線画生成における特徴的な線の自動描画に関する研究2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] A Method to Identify the Cause of Misrecognition for Offline Handwritten Japanese Character Recognition using Deep Learning2020

著者名/発表者名

学会等名

関連する報告書

行天啓二大分大学, 理工学部, 准教授 (80305028)