2019 Fiscal Year Research-status Report
Development of an acceleration framework for image processing using architectures with tensor processing
Project/Area Number |
19K24368
|
Research Institution | Tokyo University of Science |
Principal Investigator |
前田 慶博 東京理科大学, 工学部電気工学科, 助教 (80843375)
|
Project Period (FY) |
2019-08-30 – 2021-03-31
|
Keywords | 画像処理 / 計算機アーキテクチャ / 高能率計算 / ハードウェアアクセラレーション / GPU / 行列演算機構 |
Outline of Annual Research Achievements |
本研究課題は,画像処理において行列演算機構を有する計算機アーキテクチャを有効的に使用した高速化手法を学術的に明らかにすることに加えて,その知見を学術的に体系化したフレームワークを構築することを目的としている.行列演算機構はDeep Neural Networkなどで多く発生する行列の積和演算を高速に実現するハードウェアアクセラレータである.この課題において,固定サイズの行列演算を行うことを前提とする行列演算機構における計算機アーキテクチャの観点からの効率的な活用方法は未知である.加えて,行列演算機構は,精度の制約も存在する.これらを画像処理と計算機アーキテクチャの双方の学術領域から体系化を行う. 2019年度は,まず,行列演算機構の画像処理アルゴリズムへの適用のために,ガウシアンフィルタやバイラテラルフィルタ,DCTデノイジングの三つのアルゴリズムにおける活用方法について検討を行った.行列演算機構の活用のためには,アルゴリズムの再定義が必要である.本年度は,CPUに搭載されている並列演算機構によって行列演算機構を用いる場合と同等の条件について検証を行った.また,行列演算機構における演算精度制限が画像処理アルゴリズムに及ぼす影響検証のためにバイラテラルフィルタの演算精度についても検証を行った.これは,行列演算機構が高速化のために,従来の32bit長や64bit長の数値データではなく16bit長のデータを扱うため重要な検討事項である.この他,GPU上で画像データを扱いやすくするオペレータの提案も行い,本研究課題の遂行の効率化,更にフレームワーク構築にむけた準備も進んでいる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2019年度は,行列演算機構による画像処理アルゴリズムの効率的な実装に向けた検討を行った.具体的な検討項目は,画像処理アルゴリズムの行列演算による再定義と行列演算機構のもつ低い数値精度が画像処理結果の精度に及ぼす影響の検討である.前者は,ガウシアンフィルタとバイラテラルフィルタ,DCTデノイジングを対象として進んでいる.これらのアルゴリズムはデノイジングや霞除去など様々な画像処理アルゴリズムにおける基本的な処理であり対象とした.後者については,バイラテラルフィルタの演算方法と数値精度の違いによる精度劣化について検討を行い,多くの発見が得られている.また,この他に, GPU上での画像データのより簡易に操作可能なオペレータの提案をした.これは,本研究課題における検討の効率化に加えて,フレームワーク構築に向けたものでもある.
|
Strategy for Future Research Activity |
最終年度では,行列演算機構を有するGPUなどにおける実際の実装を行い,フレームワークの構築を目指す.2019年度の検討で,行列演算機構の画像処理アルゴリズムの活用方法や精度劣化の影響などの重要な部分の検証は進んでいる.最終年度では,行列演算機構を用いる場合のメモリ使用量やアクセスパターンによるキャッシュ階層における影響の検証を進めると共に,検証結果より行列演算機構を活用した実装パターンの構築を行う.そして,それを総括した画像処理アルゴリズムの高速化フレームワークの構築を目指す.
|
Causes of Carryover |
新型コロナウィルス蔓延により,予定していた学会と出張が中止されたためである.これまでの検討により,性能の異なるGPUによる調査が必要であることが分かっており,性能の異なるGPUの購入に活用予定である.
|