2019 Fiscal Year Annual Research Report
A study on sparse representation of high-resolution video based on directional tensor dictionary
Project/Area Number |
17K14683
|
Research Institution | The University of Kitakyushu |
Principal Investigator |
京地 清介 北九州市立大学, 国際環境工学部, 准教授 (70634616)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 辞書学習 / 多層スパース表現 / オンライン学習 / 凸最適化 / エピグラフ変形 |
Outline of Annual Research Achievements |
本研究では高解像度映像をスパースに表現するための多次元テンソル辞書を効率よく設計する手法を確立することを目的としている.多次元テンソル辞書を設計する際,その辞書の次元の高さから,最適化の対象となる辞書のパラメータ数は膨大になるため最適化は困難となる.従って,パラメータ数を効率よく削減するためのアルゴリズムが必要とされている. 平成30年度の研究では平成29年度に構成したコサインサイン変調フィルタバンクの辞書に線形結合を施して新たな辞書を生成する手法(二層スパース表現)を構成した.最終年度の平成31年度・令和元年度は,二層スパース表現を拡張した.具体的には,ベースとなるコサインサイン変調フィルタバンクに対して多層の線形結合施すことで,様々な高解像度映像をスパースに表現する方式(多層スパース表現)を構成した. 多層の線形結合係数は,大規模なデータセットからの学習によって決定する必要があり演算コストは膨大となる.更に各層の線形結合係数を効率良く決定するアルゴリズムがないため,新たに構成する必要がある.まず大規模データセットの学習に関しては確率的最適化によるオンライン辞書学習(テストデータからランダムに部分データセットを取り出しパラメータを更新する方法)を用いた.一方,各層の線形結合係数パラメータの効率的な学習アルゴリズムとして,エピグラフ変形を用いた多層ノルム関数最小化アルゴリズムを開発した.多層のパラメータを決定するために導入するノルム関数も多層の合成関数となるため,近接写像を閉形式で求めることは困難となる.本研究で新たに開発したエピグラフ変形は,一層一層のノルム関数をエピグラフ集合制約に変形することで,各々のエピグラフ射影さえ効率良く求めれば,全体の多層合成ノルム関数の最小化を解決することができることを示した.
|