Project/Area Number |
22K04107
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 21020:Communication and network engineering-related
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
中静 真 千葉工業大学, 工学部, 教授 (10251787)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
|
Keywords | 画像処理 / 深層学習 / マセマティカルモフォロジー / ノイズ除去 / SIMD演算 / エッジコンピューティング / 拡散方程式 / 組み込みシステム / 低精度演算 / マセマティカルモフォロジ |
Outline of Research at the Start |
本研究では,小規模なハードウェアにおいて高度な画像処理を実現するために,低精度数値表現による汎用的な画像処理のフレームワークを提案する.提案法は,熱の平衡状態へ至る過程を示す拡散方程式と,局所最大と局所最小を組み合わせた画像の勾配およびラプラシアンを計算するビルディングブロックに基づく.深層展開された拡散方程式をビルディングブロックで構築することで,高速・低メモリコストのアルゴリズムを構築し,汎用的な画像処理の基盤を構築する.また,ネットワークの特性を調べ,その訓練に活用すると共に,組込みシステムによる効果的な実装方法を提案する.
|
Outline of Annual Research Achievements |
本研究の目的は,画像処理を,IoT機器などの極小規模のエッジデバイス上で実現するために,低精度の計算で実現できる深層ネットワークの構成を提案することである.昨年度に提案したマセマティカルモフォロジを用いた拡散過程の深層展開から得られた画像処理ネットワークの汎用性を高めるために,1回のネットワークのパラメータの訓練により,様々なノイズ標準偏差に対応できるネットワーク構造を提案した.これはノイズ標準偏差をパラメータとして,深層ネットワークの各階層で推定されたノイズの強度を制御する方法である.実験の結果,パラメータをノイズ標準偏差毎に訓練し,最適化した場合と,ほぼ同等の性能が1回の訓練によるパラメータで実現できることがわかった.さらに,提案法を超低消費電力デバイスで実装させるための実装法を検討した.対象としてARM社のCortex M4を選び,新たにSIMD(Single Instruction Multiple Dataset)を使った演算方式を提案した.提案した方法では,飽和演算を用いて最大値・最小値関数を4つのデータに対して同時に計算することができる.新たに考案した関数を用いて提案法に適用し,Cortex M4のマイコンに実装を行った.実装結果より,提案法により画像の容量の2倍程度のメモリ容量で,毎秒1枚程度のノイズ除去を実現できることを示した. 提案した深層ネットワークでは乗算の無い画像処理体系であるモフォロジカル演算を活用しているが,ノイズ除去以外の応用としてオートエンコーダ(自己符号化器)への応用を検討した.画像の次元削減と再構成を数段にわたるモフォロジカルフィルタで実現した.文字画像を対象として異常検出の実験を行い,従来の畳み込みによるオートエンコーダよりも高い精度で異常を検出し,さらに少ないパラメータで実装できることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
前年度提案した画像処理ネットワークでは,画像の劣化の要因となるノイズの情報を事前に推定した上で,ノイズ除去ネットワークのパラメータを訓練する必要があった.実用面では,ノイズの情報を事前に推定することは困難であり,さらに,パラメータの訓練にも大きなコストがかかる.この問題を解決するために,ノイズの変化に追従できるネットワークを構成した.これは,実環境で様々な劣化を含んだ画像を処理するためには必須の要素であり,研究に有意な進展があったといえる.また,新たに小規模なマイクロプロセッサでの実装も行った.この実装により,提案法の汎用性の高さ,また,さまざまなプロセッサでのアーキテクチャでも提案法の有効性を発揮できることを示した.
|
Strategy for Future Research Activity |
本年度の研究成果をもとに今後,二つの方向で研究を展開する予定である.一つは,自己注意機構(Self-attention)とブラインド画像処理の実現である.本年度,ノイズの変化に追従するネットワークを提案した.これは,画像からノイズの情報を抽出するネットワークを画像処理と独立に設定し,画像処理へ抽出結果を反映させる構造となっている.この構造は,データから特徴を抽出し,データ自体に掛け合わせることで特徴を強調する自己注意機構と同じ構造である.自己注意機構はトランスフォーマーの主たる原理であり,多くの生成AIで活用されている.ノイズに注目し性能を向上させる機構と自己注意機構との関連を明らかにし,提案法の性能を向上させる.さらに,ノイズだけでなく様々な劣化情報も推定し,劣化に関する先見情報無しに画像を復元する方法へ提案法を発展させる.もう一つの方向として,今年度の研究で提案したネットワークの基本構造を,ニューラルネットワークのニューロンとして用い,汎用的なネットワークへと拡張することが挙げられる.汎用ニューラルネットワークで取り上げられる問題である文字認識,一般画像認識へ提案法を応用し,エッジデバイス向けに低精度計算が実現できることを示す.
|