Image processing networks with low-precision arithmetic

Research Project

Project/Area Number	22K04107
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 21020:Communication and network engineering-related
Research Institution	Chiba Institute of Technology
Principal Investigator	中静真千葉工業大学, 工学部, 教授 (10251787)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000) Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000) Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Keywords	画像処理 / 深層学習 / マセマティカルモフォロジー / ノイズ除去 / SIMD演算 / エッジコンピューティング / 拡散方程式 / 組み込みシステム / 低精度演算 / マセマティカルモフォロジ
Outline of Research at the Start	本研究では，小規模なハードウェアにおいて高度な画像処理を実現するために，低精度数値表現による汎用的な画像処理のフレームワークを提案する．提案法は，熱の平衡状態へ至る過程を示す拡散方程式と，局所最大と局所最小を組み合わせた画像の勾配およびラプラシアンを計算するビルディングブロックに基づく．深層展開された拡散方程式をビルディングブロックで構築することで，高速・低メモリコストのアルゴリズムを構築し，汎用的な画像処理の基盤を構築する．また，ネットワークの特性を調べ，その訓練に活用すると共に，組込みシステムによる効果的な実装方法を提案する．
Outline of Annual Research Achievements	本研究の目的は，画像処理を，IoT機器などの極小規模のエッジデバイス上で実現するために，低精度の計算で実現できる深層ネットワークの構成を提案することである．昨年度に提案したマセマティカルモフォロジを用いた拡散過程の深層展開から得られた画像処理ネットワークの汎用性を高めるために，1回のネットワークのパラメータの訓練により，様々なノイズ標準偏差に対応できるネットワーク構造を提案した．これはノイズ標準偏差をパラメータとして，深層ネットワークの各階層で推定されたノイズの強度を制御する方法である．実験の結果，パラメータをノイズ標準偏差毎に訓練し，最適化した場合と，ほぼ同等の性能が1回の訓練によるパラメータで実現できることがわかった．さらに，提案法を超低消費電力デバイスで実装させるための実装法を検討した．対象としてARM社のCortex M4を選び，新たにSIMD(Single Instruction Multiple Dataset)を使った演算方式を提案した．提案した方法では，飽和演算を用いて最大値・最小値関数を4つのデータに対して同時に計算することができる．新たに考案した関数を用いて提案法に適用し，Cortex M4のマイコンに実装を行った．実装結果より，提案法により画像の容量の２倍程度のメモリ容量で，毎秒1枚程度のノイズ除去を実現できることを示した．提案した深層ネットワークでは乗算の無い画像処理体系であるモフォロジカル演算を活用しているが，ノイズ除去以外の応用としてオートエンコーダ(自己符号化器)への応用を検討した．画像の次元削減と再構成を数段にわたるモフォロジカルフィルタで実現した．文字画像を対象として異常検出の実験を行い，従来の畳み込みによるオートエンコーダよりも高い精度で異常を検出し，さらに少ないパラメータで実装できることを示した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 前年度提案した画像処理ネットワークでは，画像の劣化の要因となるノイズの情報を事前に推定した上で，ノイズ除去ネットワークのパラメータを訓練する必要があった．実用面では，ノイズの情報を事前に推定することは困難であり，さらに，パラメータの訓練にも大きなコストがかかる．この問題を解決するために，ノイズの変化に追従できるネットワークを構成した．これは，実環境で様々な劣化を含んだ画像を処理するためには必須の要素であり，研究に有意な進展があったといえる．また，新たに小規模なマイクロプロセッサでの実装も行った．この実装により，提案法の汎用性の高さ，また，さまざまなプロセッサでのアーキテクチャでも提案法の有効性を発揮できることを示した．
Strategy for Future Research Activity	本年度の研究成果をもとに今後，二つの方向で研究を展開する予定である．一つは，自己注意機構(Self-attention)とブラインド画像処理の実現である．本年度，ノイズの変化に追従するネットワークを提案した．これは，画像からノイズの情報を抽出するネットワークを画像処理と独立に設定し，画像処理へ抽出結果を反映させる構造となっている．この構造は，データから特徴を抽出し，データ自体に掛け合わせることで特徴を強調する自己注意機構と同じ構造である．自己注意機構はトランスフォーマーの主たる原理であり，多くの生成AIで活用されている．ノイズに注目し性能を向上させる機構と自己注意機構との関連を明らかにし，提案法の性能を向上させる．さらに，ノイズだけでなく様々な劣化情報も推定し，劣化に関する先見情報無しに画像を復元する方法へ提案法を発展させる．もう一つの方向として，今年度の研究で提案したネットワークの基本構造を，ニューラルネットワークのニューロンとして用い，汎用的なネットワークへと拡張することが挙げられる．汎用ニューラルネットワークで取り上げられる問題である文字認識，一般画像認識へ提案法を応用し，エッジデバイス向けに低精度計算が実現できることを示す．

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(8 results)

All 2023 2022 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results) (of which Int'l Joint Research: 1 results) Remarks (2 results)

[Journal Article] Deep Unrolling of Non-Linear Diffusion with Extended Morphological Laplacian2023
- Author(s)
  OKADA Gouki, NAKASHIZUKA Makoto
- Journal Title
  
  IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
  
  Volume: E106.A Issue: 11 Pages: 1395-1405
- DOI
  10.1587/transfun.2023SMP0004
- ISSN
  0916-8508, 1745-1337
- Year and Date
  2023-11-01
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Presentation] 非線形拡散に基づく深層ガウス性ノイズ除去ネットワークのノイズ標準偏差による制御2023
- Author(s)
  中静真，濱田美明，白岩良菓，岡田剛季
- Organizer
  第38回信号処理シンポジウム
- Related Report
  2023 Research-status Report
[Presentation] Deep unrolling of diffusuion process with morphological Laplacian and its implementation with SIMD instructions2022
- Author(s)
  Gouki Okasa, Makoto Nakashizuka
- Organizer
  2022 IEEE International Conference on Image Processing
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] メジアンフィルタの訓練可能なモフォロジカル演算への分解とインパルス性雑音除去への応用2022
- Author(s)
  前田浩希，中静　真
- Organizer
  第37回信号処理シンポジウム
- Related Report
  2022 Research-status Report
[Presentation] モフォロジカル演算によるプーリングを用いたオートエンコーダ2022
- Author(s)
  三神直哉，中静　真
- Organizer
  第37回信号処理シンポジウム
- Related Report
  2022 Research-status Report
[Presentation] モフォロジカルラプラシアンに基づく非線形拡散の深層展開2022
- Author(s)
  中静　真，岡田剛季
- Organizer
  電子情報通信学会信号処理研究会
- Related Report
  2022 Research-status Report
[Remarks] 加算と最大値・最小値演算による熱拡散方程式の離散化と深層ネットワーク
- URL
  https://nakashizuka.jp/contents_study.html
- Related Report
  2023 Research-status Report
[Remarks]
- URL
  https://github.com/Nkszk/Pymorph
- Related Report
  2022 Research-status Report

Image processing networks with low-precision arithmetic

Principal Investigator

中静 真 千葉工業大学, 工学部, 教授 (10251787)

¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Deep Unrolling of Non-Linear Diffusion with Extended Morphological Laplacian2023

Author(s)

Journal Title

DOI

ISSN

Year and Date

Related Report

[Presentation] 非線形拡散に基づく深層ガウス性ノイズ除去ネットワークのノイズ標準偏差による制御2023

Author(s)

Organizer

Related Report

[Presentation] Deep unrolling of diffusuion process with morphological Laplacian and its implementation with SIMD instructions2022

Author(s)

Organizer

Related Report

[Presentation] メジアンフィルタの訓練可能なモフォロジカル演算への分解とインパルス性雑音除去への応用2022

Author(s)

Organizer

Related Report

[Presentation] モフォロジカル演算によるプーリングを用いたオートエンコーダ2022

Author(s)

Organizer

Related Report

[Presentation] モフォロジカルラプラシアンに基づく非線形拡散の深層展開2022

Author(s)

Organizer

Related Report

[Remarks] 加算と最大値・最小値演算による熱拡散方程式の離散化と深層ネットワーク

URL

Related Report

[Remarks]

URL

Related Report

中静真千葉工業大学, 工学部, 教授 (10251787)