2023 年度実施状況報告書

低精度数値表現による画像処理ネットワークの構築

研究課題

研究課題/領域番号	22K04107
研究機関	千葉工業大学
研究代表者	中静真千葉工業大学, 工学部, 教授 (10251787)
研究期間 (年度)	2022-04-01 – 2025-03-31
キーワード	画像処理 / 深層学習 / マセマティカルモフォロジー / ノイズ除去 / SIMD演算 / エッジコンピューティング / 拡散方程式
研究実績の概要	本研究の目的は，画像処理を，IoT機器などの極小規模のエッジデバイス上で実現するために，低精度の計算で実現できる深層ネットワークの構成を提案することである．昨年度に提案したマセマティカルモフォロジを用いた拡散過程の深層展開から得られた画像処理ネットワークの汎用性を高めるために，1回のネットワークのパラメータの訓練により，様々なノイズ標準偏差に対応できるネットワーク構造を提案した．これはノイズ標準偏差をパラメータとして，深層ネットワークの各階層で推定されたノイズの強度を制御する方法である．実験の結果，パラメータをノイズ標準偏差毎に訓練し，最適化した場合と，ほぼ同等の性能が1回の訓練によるパラメータで実現できることがわかった．さらに，提案法を超低消費電力デバイスで実装させるための実装法を検討した．対象としてARM社のCortex M4を選び，新たにSIMD(Single Instruction Multiple Dataset)を使った演算方式を提案した．提案した方法では，飽和演算を用いて最大値・最小値関数を4つのデータに対して同時に計算することができる．新たに考案した関数を用いて提案法に適用し，Cortex M4のマイコンに実装を行った．実装結果より，提案法により画像の容量の２倍程度のメモリ容量で，毎秒1枚程度のノイズ除去を実現できることを示した．提案した深層ネットワークでは乗算の無い画像処理体系であるモフォロジカル演算を活用しているが，ノイズ除去以外の応用としてオートエンコーダ(自己符号化器)への応用を検討した．画像の次元削減と再構成を数段にわたるモフォロジカルフィルタで実現した．文字画像を対象として異常検出の実験を行い，従来の畳み込みによるオートエンコーダよりも高い精度で異常を検出し，さらに少ないパラメータで実装できることを示した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由前年度提案した画像処理ネットワークでは，画像の劣化の要因となるノイズの情報を事前に推定した上で，ノイズ除去ネットワークのパラメータを訓練する必要があった．実用面では，ノイズの情報を事前に推定することは困難であり，さらに，パラメータの訓練にも大きなコストがかかる．この問題を解決するために，ノイズの変化に追従できるネットワークを構成した．これは，実環境で様々な劣化を含んだ画像を処理するためには必須の要素であり，研究に有意な進展があったといえる．また，新たに小規模なマイクロプロセッサでの実装も行った．この実装により，提案法の汎用性の高さ，また，さまざまなプロセッサでのアーキテクチャでも提案法の有効性を発揮できることを示した．
今後の研究の推進方策	本年度の研究成果をもとに今後，二つの方向で研究を展開する予定である．一つは，自己注意機構(Self-attention)とブラインド画像処理の実現である．本年度，ノイズの変化に追従するネットワークを提案した．これは，画像からノイズの情報を抽出するネットワークを画像処理と独立に設定し，画像処理へ抽出結果を反映させる構造となっている．この構造は，データから特徴を抽出し，データ自体に掛け合わせることで特徴を強調する自己注意機構と同じ構造である．自己注意機構はトランスフォーマーの主たる原理であり，多くの生成AIで活用されている．ノイズに注目し性能を向上させる機構と自己注意機構との関連を明らかにし，提案法の性能を向上させる．さらに，ノイズだけでなく様々な劣化情報も推定し，劣化に関する先見情報無しに画像を復元する方法へ提案法を発展させる．もう一つの方向として，今年度の研究で提案したネットワークの基本構造を，ニューラルネットワークのニューロンとして用い，汎用的なネットワークへと拡張することが挙げられる．汎用ニューラルネットワークで取り上げられる問題である文字認識，一般画像認識へ提案法を応用し，エッジデバイス向けに低精度計算が実現できることを示す．
次年度使用額が生じた理由	既存の開発環境により，提案法を検証することができたので，新規に購入する物品が減った．また，今年度の成果を次年度には論文等で発表する予定であり，そのための旅費および学会参加費として利用することを計画している．