2018 Fiscal Year Research-status Report
A study on sparse representation of high-resolution video based on directional tensor dictionary
Project/Area Number |
17K14683
|
Research Institution | The University of Kitakyushu |
Principal Investigator |
京地 清介 北九州市立大学, 国際環境工学部, 准教授 (70634616)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 指向性テンソル辞書 / コサインサイン変調フィルタバンク / 最適化 / 構造テンソル全変動量 |
Outline of Annual Research Achievements |
本課題では高解像度映像をスパースに表現するための多次元テンソル辞書を効率よく設計する手法を確立することを目的としている.多次元テンソル辞書を設計する際,その辞書の次元の高さから,最適化の対象となる辞書のパラメータ数は膨大になるため最適化は困難となる.従って,パラメータ数を効率よく削減するためのアルゴリズムが必要とされている.
平成29年度は高解像度映像の時空間方向の指向性の表現に優れた固定型指向性テンソル辞書である"コサインサイン変調フィルタバンク"を構成したが,平成30年度の研究では コサインサイン変調フィルタバンクに線形結合を施して更新した新しい辞書によって,更に効率のよい高解像度映像スパース表現を達成することを目的とし検討を行った.
具体的なアプローチとして,映像の局所領域における勾配ベクトルセットの従属性を考慮した最適化手法を導入した.高解像度映像の局所領域では,時空間方向の勾配ベクトル(隣接画素の差分情報)が似通った方向を示す傾向がある.従来手法として提案された「構造テンソル全変動量正則化」では,勾配ベクトルの類似性を低ランク性によって特徴づけた凸最適化を構成し,詳細なテクスチャを豊富に含む映像に対しても柔軟な表現を可能にしている.本研究では「隣接画素の差分情報のみならず,更に離れた場所に位置する画素との差分情報も類似する」と考え,複数の解像度の勾配ベクトルに基づく「多重解像度構造テンソル全変動量正則化」を導入し,頑健性の高い最適化手法を構成した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は前年度に設計したコサインサイン変調フィルタバンクの線形結合によって高解像度をスパースに表現するためのフレームワークを検討した.当初のように,スパース性・低ランク性に基づく「多重解像度構造テンソル全変動量正則化」を構成できたため,概ね順調に進展していると考える.
|
Strategy for Future Research Activity |
テスト高解像度映像のデータ数は膨大になるため,来年度は確率的最適化によるオンライン辞書学習(テストデータからランダムに部分データセットを取り出し最適化を繰り返す)を導入し,辞書のより効率的な学習を達成する.本研究ではオンライン辞書学習として既に提案されている確率的ADMM辞書学習の手法を基に検討する.ただし,ADMMでは最適化中に逆行列演算が必要となり,多大な計算コストが発生する可能性がある. ADMMとは別の最適化手法であるPrimal-dual splitting(PDS)は逆行列演算を必要としない特徴を持つため,ADMMでの検討が困難な場合にはPDSによる手法の構成を検討する.
|
Causes of Carryover |
当初は様々なセンサを購入してテストデータを収集する予定だった。しかしながら研究課題検討の中で、現段階では未だアルゴリズムの構築と簡易なサンプルデータ等を用いた有効性の確認を行えば十分と判断し、購入を見送ることにした。全体のアルゴリズムが整備される来年度(最終年度)にて、予定していた機材の購入、網羅的なデータ収集、提案アルゴリズムの検証を行う予定である。
|
Research Products
(5 results)