大規模データを用いて作成した畳み込み型スパース辞書による分散圧縮符号化と深層学習

研究課題

研究課題/領域番号	23K11159
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	久留米工業高等専門学校
研究代表者	黒木祥光久留米工業高等専門学校, 制御情報工学科, 教授 (60290847)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2025年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2023年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード	畳み込み型スパース表現 / 分散圧縮符号化 / 深層学習 / 凸最適化
研究開始時の研究の概要	現在のAIブームは畳み込みニューラルネットワーク（CNN）が画像認識のコンテストILSVRC 2012にて他の手法を凌駕したことに起因する．本研究で検討する畳み込み型スパース表現は，与えられた画像を複数の畳み込みカーネルと対応する特徴マップの和で近似するため，CNNとの親和性が高い．スパースとは特徴マップに多数のゼロ要素を含むことであり，CNNより特徴的かつ高精度なフィルタが設計されている可能性がある．更に，学習用画像が少数で済むとの利点も有する．本研究では外れ値を含む学習用画像への頑健性と大規模データでカーネルを設計できるような工夫を加え，分散圧縮符号化と深層学習に応用する．
研究実績の概要	画像信号のスパース表現は，与えられた信号をできるだけ少数のベクトルの線形結合によって近似する方法であり，多くの分野で活用されている．その方法は，与えられた信号と同次元のベクトルの線形結合を用いる方法，複数の畳み込みカーネルと特徴マップの和で表現する方法，の2つに大別できる．前者の場合，一般に画像を重複しない矩形ブロックに分割し，ブロック毎に処理を行うが，同じ位置にあるブロックを常に処理対象とするため，位置ずれに対する頑健性が低い．一方，後者では，位置ずれは特徴マップの非ゼロ係数の位置変化によって表現されるため，畳み込みカーネルは位置ずれに対して頑健性が高い．令和5年度は畳み込みスパース表現を用いた分散圧縮符号化，非ゼロ係数の位置に着目して画像の位置ずれ対して頑健なVision Transform (ViT) などについて研究した．ViTは画像を固定のブロックに分割し，そのブロックの関係性を広域的に求めるため，畳み込みカーネルを用いて局所的な特徴抽出を行う畳み込みニューラルネットワーク（CNN）と異なり，近年注目されているが，固定ブロックに着目する限り，位置ずれに対する頑健性は低い．それを非ゼロ係数の位置で補正したものである．得られた成果はInternational Workshop on Advanced Imaging Technology (IWAIT) 2024にて6件の口頭発表を行った．そのうち3件はSPIE Digital LibraryのProceedings volume 13164にて公開されている．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究は令和2年度から4年度の科学研究費助成事業「l1ノルム損失における畳み込み型スパース表現と分散圧縮符号化・深層学習への展開」（課題番号20K11878）の発展であり，コンセンサス方式を用いた大規模データにおけるカーネル辞書の作成と畳み込みニューラルネットワークと異なる深層学習，例えばVision Transform等への適応に新規性がある．令和5年度は中規模のデータを用い，L1ノルム損失における成果を残しており，おおむね順調に進展していると判断した．
今後の研究の推進方策	令和6年度は令和5年度の成果を踏まえ，大規模データでの実行を試みる．既に近似精度に関してはL1ノルム損失が有効であるとの成果を得ているため，分散圧縮符号化等での性能向上が見込められる．ところで，畳み込みスパース表現では計算を高速化するために畳み込み演算をフーリエ領域におけるアダマール積で行っている．一般に畳み込みカーネルの画素数は画像の画素数よりも少ない．従って，フーリエ領域における係数ベクトルの次元を均一化するためにカーネルに対するパディングが行われる．令和5年度途中よりパディング法に関する検討を行い，近似精度自体を向上させる成果を得ているため，その内容を報告するとともに，各種手法に組み入れて更なる精度向上を試みる予定である．

報告書

(1件)

2023 実施状況報告書

研究成果
(10件)

すべて 2024 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (6件) (うち国際学会 6件) 備考 (1件)

[雑誌論文] Vision transformer with pre-positional embedding2024
- 著者名/発表者名
  Eguchi Takuro、Kuroki Yoshimitsu
- 雑誌名
  
  Proc. SPIE
  
  巻: 13164 ページ: 13-13
- DOI
  10.1117/12.3018012
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Distributed compressed video sensing based on convolutional sparse coding using Fourier measurement matrix and L1 fidelity term2024
- 著者名/発表者名
  Eguchi Takuro、Gondo Yudai、Kuroki Yoshimitsu
- 雑誌名
  
  Proc. SPIE
  
  巻: 13164 ページ: 105-105
- DOI
  10.1117/12.3019408
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Generation of graph embedding vectors based on graph isomorphism problem2024
- 著者名/発表者名
  Higuchi Yosuke、Kuroki Yoshimitsu
- 雑誌名
  
  Proc. SPIE
  
  巻: 13164 ページ: 1316432-1316432
- DOI
  10.1117/12.3019647
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] Distributed Compressed Video Sensing based on Convolutional Sparse Coding using Fourier Measurement Matrix and L1 Fidelity Term2024
- 著者名/発表者名
  Takuro Eguchi, Yoshimitsu Kuroki
- 学会等名
  International Workshop on Advanced Image Technology 2024 (IWAIT 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] . Generation of graph embedding vectors based on graph isomorphism problem2024
- 著者名/発表者名
  Yosuke Higuchi, Yoshimitsu Kuroki
- 学会等名
  International Workshop on Advanced Image Technology 2024 (IWAIT 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Distributed Compressed Video Sensing based on Convolutional Sparse Representation2024
- 著者名/発表者名
  Yosuke Higuchi, Yoshimitsu Kuroki
- 学会等名
  International Workshop on Advanced Image Technology 2024 (IWAIT 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] A Patch Embedding in Vision Transformer robust against Positional Variation2024
- 著者名/発表者名
  Keigo Shibata, Mitsuki Sueyasu, Yoshimitsu Kuroki
- 学会等名
  International Workshop on Advanced Image Technology 2024 (IWAIT 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] More meaningful patches for Vision Transformer using Convolutional Sparse Representation2024
- 著者名/発表者名
  Yudai Inada, Yuto Tsukiashi, Yoshimitsu Kuroki
- 学会等名
  International Workshop on Advanced Image Technology 2024 (IWAIT 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Vision Transformer with pre-positional embedding2024
- 著者名/発表者名
  Takuro Eguchi, Yoshimitsu Kuroki
- 学会等名
  International Workshop on Advanced Image Technology 2024 (IWAIT 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[備考] Research map 黒木祥光
- URL
  https://researchmap.jp/read0047048
- 関連する報告書
  2023 実施状況報告書

大規模データを用いて作成した畳み込み型スパース辞書による分散圧縮符号化と深層学習

研究代表者

黒木 祥光 久留米工業高等専門学校, 制御情報工学科, 教授 (60290847)

4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Vision transformer with pre-positional embedding2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Distributed compressed video sensing based on convolutional sparse coding using Fourier measurement matrix and L1 fidelity term2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Generation of graph embedding vectors based on graph isomorphism problem2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Distributed Compressed Video Sensing based on Convolutional Sparse Coding using Fourier Measurement Matrix and L1 Fidelity Term2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] . Generation of graph embedding vectors based on graph isomorphism problem2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Distributed Compressed Video Sensing based on Convolutional Sparse Representation2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] A Patch Embedding in Vision Transformer robust against Positional Variation2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] More meaningful patches for Vision Transformer using Convolutional Sparse Representation2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Vision Transformer with pre-positional embedding2024

著者名/発表者名

学会等名

関連する報告書

[備考] Research map 黒木祥光

URL

関連する報告書

黒木祥光久留米工業高等専門学校, 制御情報工学科, 教授 (60290847)