画像信号のスパース表現は,圧縮センシングやパターン認識など,多分野で活用されているが,一般に画像全体ではなく,重複しない矩形ブロック毎に処理を行う.ブロック単位の処理は,常に同じ位置にあるブロックを対象とするため,位置ずれに対する頑健性が低い.本研究ではその欠点を解消する方法として,畳み込み型スパース表現を採用する.畳み込み型スパース表現では,非ゼロフィルタ係数の位置変化によって位置ずれを表現できるのがその理由である.また,畳み込み型辞書を学習する際,外れ値に対する頑健性を向上するため,l1ノルムを損失項に用いる.位置ずれに対する頑健性は,分散圧縮符号化におけるキーフレームとノンキーフレームの辞書の共有化を実現し,動き補償を不要とする.また,深層学習におけるプーリングを不要とする.更にフィルタ係数のスパース性は非ゼロ出力素子の低減によるネットワークの小規模化を実現する.位置ずれと外れ値,双方に対して高い頑健性を有する畳み込み型辞書フィルタを設計し,新たな分散圧縮符号化と深層学習へ展開することが本研究の目的である. 新型コロナ禍の影響があったものの予定通り分散圧縮符号化ならびに畳み込みニューラルネットワークの畳み込みフィルタを代替することにより,目論見通りの成果を残すことができた.最終的には7件の査読付国際会議にて発表し,国際会議ICIIBMS2022にてStudent Best Paper Awardを受賞した.また,大規模データでのフィルタ設計に対応するため,コンセンサスフレームワークの採用を検討し,従来のl2ノルム損失よりも係数がスパースかつ精度の高いフィルタを設計することができた.その成果は令和5年度からの科学研究費「大規模データを用いて作成した畳み込み型スパース辞書による分散圧縮符号化と深層学習」(研究番号23K11159)へと引き継ぐこととなった.
|