研究課題/領域番号 |
20K11878
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 久留米工業高等専門学校 |
研究代表者 |
黒木 祥光 久留米工業高等専門学校, 制御情報工学科, 教授 (60290847)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 畳み込み型スパース表現 / 分散圧縮符号化 / 深層学習 / 凸最適化 |
研究開始時の研究の概要 |
畳み込み型ニューラルネットワークが実用化されつつあるが,学習に膨大なデータを必要とする.本研究では少数の学習データで畳み込みフィルタを導出可能な畳み込み型スパース表現に着目する.フィルタを求める際,雑音を含んだ画像が混入する可能性があるため,本研究では外れ値に対して頑健な畳み込みフィルタを設計する.得られたフィルタとその係数マップはパターン認識のみならず,分散圧縮符号化に適用する.フィルタは画像が平行移動しても同じであるため,外れ値だけでなく位置ずれに対しても頑健な手法であり,様々な応用が期待される.
|
研究実績の概要 |
現在のAIブームは畳み込みニューラルネットワーク(CNN: Convolutional Neural Network)が画像の分類問題において既存の手法を凌駕したことを嚆矢 とする。CNNは画像の特徴を表す畳み込みフィルタとフィルタを畳み込むことによって生じる特徴マップの組を多層化することによって構成されている。CNN の学習は入力画像と所望の出力、例えばクラス分類であれば,one-hotと呼ばれる当該クラス番号だけを1、他を0とするベクトルの組を多数与え、誤差を少なくすることによって実現される。 本研究で着目する畳み込み型スパース表現はCNNと異なり、畳み込みフィルタと特徴マップに相当するフィルタ係数によって画像を近似する方法であり、少数の画像でフィルタを設計できる、また,フィルタ係数の大部分がゼロで、局所的に非ゼロとなる、つまり、スパース(疎)となるようにフィルタおよびフィルタ係数を求める。ここで、最適なフィルタを求める評価関数は、近似誤差を表す損失項とスパース性を表す正則化項の加重和で与えられる。 令和4年度は上に記した畳み込みスパース表現とCNNの親和性に着目し、畳み込みスパース表現で作成したフィルタをCNNの初期値に用いることにより、学習画像が少数の時に従来法よりも高い認識精度を得ることができた。この成果は国際会議ICIIBMS 2022にてStudent Best Paper Awardを受賞した。また、畳み込みスパース表現を分散圧縮に応用し、複数のキーフレームを用いたノンキーフレーム用の辞書作成、ならびにL1ノルムを誤差項とした場合の評価について、2件の国際ポスター発表をISIPS 2022で行った。そのうち1件はBest Presentation Awardを受賞した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題3年目(最終年度を予定)は当初の計画通り、誤差項をL1ノルムで評価した畳み込みスパース表現を深層学習、分散圧縮符号化に適用し、2件の賞を受賞することができた。従って、進捗状況はおおむね順調に進展している、と判断したが、新型コロナの影響で学会発表の機会が少なく、延長することとした。しかし、CNNではない最新の深層学習のおアーキテクチャであるVisual Transformerに畳み込みスパース表現を適用する方法について卒業研究レベルで成果を残しており、令和5年度に発表する予定である。
|
今後の研究の推進方策 |
【現在までの進捗状況】で触れたが、最新のアーキテクチャへの応用について成果が得られたため、これを推進する。また、令和3年度の成果として、大規模データに用いることのできる、外れ値に対して頑健な畳み込みフィルタ設計の成果を残したため、これを深層学習や分散圧縮符号化に適用したい。
|