2022 Fiscal Year Research-status Report
Convolutional sparse representation of l1 norm error criterion and its development for distributed video coding and deep learning
Project/Area Number |
20K11878
|
Research Institution | Kurume National College of Technology |
Principal Investigator |
黒木 祥光 久留米工業高等専門学校, 制御情報工学科, 教授 (60290847)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 畳み込み型スパース表現 / 分散圧縮符号化 / 深層学習 / 凸最適化 |
Outline of Annual Research Achievements |
現在のAIブームは畳み込みニューラルネットワーク(CNN: Convolutional Neural Network)が画像の分類問題において既存の手法を凌駕したことを嚆矢 とする。CNNは画像の特徴を表す畳み込みフィルタとフィルタを畳み込むことによって生じる特徴マップの組を多層化することによって構成されている。CNN の学習は入力画像と所望の出力、例えばクラス分類であれば,one-hotと呼ばれる当該クラス番号だけを1、他を0とするベクトルの組を多数与え、誤差を少なくすることによって実現される。 本研究で着目する畳み込み型スパース表現はCNNと異なり、畳み込みフィルタと特徴マップに相当するフィルタ係数によって画像を近似する方法であり、少数の画像でフィルタを設計できる、また,フィルタ係数の大部分がゼロで、局所的に非ゼロとなる、つまり、スパース(疎)となるようにフィルタおよびフィルタ係数を求める。ここで、最適なフィルタを求める評価関数は、近似誤差を表す損失項とスパース性を表す正則化項の加重和で与えられる。 令和4年度は上に記した畳み込みスパース表現とCNNの親和性に着目し、畳み込みスパース表現で作成したフィルタをCNNの初期値に用いることにより、学習画像が少数の時に従来法よりも高い認識精度を得ることができた。この成果は国際会議ICIIBMS 2022にてStudent Best Paper Awardを受賞した。また、畳み込みスパース表現を分散圧縮に応用し、複数のキーフレームを用いたノンキーフレーム用の辞書作成、ならびにL1ノルムを誤差項とした場合の評価について、2件の国際ポスター発表をISIPS 2022で行った。そのうち1件はBest Presentation Awardを受賞した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題3年目(最終年度を予定)は当初の計画通り、誤差項をL1ノルムで評価した畳み込みスパース表現を深層学習、分散圧縮符号化に適用し、2件の賞を受賞することができた。従って、進捗状況はおおむね順調に進展している、と判断したが、新型コロナの影響で学会発表の機会が少なく、延長することとした。しかし、CNNではない最新の深層学習のおアーキテクチャであるVisual Transformerに畳み込みスパース表現を適用する方法について卒業研究レベルで成果を残しており、令和5年度に発表する予定である。
|
Strategy for Future Research Activity |
【現在までの進捗状況】で触れたが、最新のアーキテクチャへの応用について成果が得られたため、これを推進する。また、令和3年度の成果として、大規模データに用いることのできる、外れ値に対して頑健な畳み込みフィルタ設計の成果を残したため、これを深層学習や分散圧縮符号化に適用したい。
|
Causes of Carryover |
海外を含む国際会議等での発表を計画していたが、新型コロナの影響で旅費を利用することができなかったため。令和5年度は4年度までに得た成果の発表における旅費、参加費等に使用する予定である。
|