研究課題/領域番号 |
18K11367
|
研究機関 | 北海道大学 |
研究代表者 |
小川 貴弘 北海道大学, 情報科学研究院, 准教授 (20524028)
|
研究分担者 |
長谷山 美紀 北海道大学, 情報科学研究院, 教授 (00218463)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | スパース表現 / 畳み込みスパース / 辞書学習 / 画質評価 / 低演算量・低容量化 |
研究実績の概要 |
本研究では、低演算量・低容量畳み込みスパース表現技術の構築を目指す。具体的に、表現係数をバイナリとすることで、「最近傍基底探索に基づくスパース近似」と「単純な加算のみの辞書学習」を可能とし、画質評価指標に一切依存しない低演算量の畳み込みスパース表現を実現するものである。令和元年度は、「畳み込みバイナリスパース表現の実現」に関する研究開発を実施した。具体的に、前年度までに実現されたバイナリスパース表現に関する理論に、畳み込みスパース表現手法を導入することで、表現能力の向上とさらなる演算量の削減を目指した。本研究実施の結果、畳み込みスパース表現を用いることにより、対象画像をよりスパースな表現係数で高精度に近似可能となるため、バイナリスパース表現における最近傍基底の探索回数・辞書学習における加算回数の削減による低演算量化と近似性能の向上を同時に実現した。以上に加えて、バイナリスパース表現の汎用性検証についても実施しており、本表現方法が、画質評価指標に依存せずに適用することが可能であり、これまでの平均二乗誤差に基づく評価指標のみで導出可能であった問題を、他の指標、特に偏微分が困難な指標においても同様に適用可能になることを明らかにした。これまで、多くの画質評価指標が提案されているが、これらを用いたスパース表現の解析的な最適化が困難である問題に対して、ブレークスルーを生み出すことが可能になった。実際の画像復元、具体的に超解像やインペインティングの問題に対して適用することで、新しい画質評価指標に基づいた画像の再構成が高精度に可能になることも明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究実績の概要に述べた通り、令和元年度は、前年度までに実現されたバイナリスパース表現に関する理論に、畳み込みスパース表現手法を導入することで、表現能力の向上とさらなる演算量の削減を可能とする理論を計画通りに達成している。 さらに、本年度は、これまで実現された理論の多様な分野への実応用について検討をすることで、多くの研究成果を得ている。したがって、当初の計画以上に研究が進捗していると判断した。
|
今後の研究の推進方策 |
今後は、以下のフェーズをそれぞれ実施する予定である。 【フェーズ3】自己組織化辞書学習の導入による低容量化の実現: 本フェーズでは、フェーズ2までに実現される畳み込みバイナリスパース表現に対し、自己組織化辞書学習を導入することで、画像と同時に辞書の再構成を可能とする。具体的に、反復縮小写像系の原理に基づいて、辞書に含まれる基底を画像から切り出される局所領域の縮小写像により導出することで、画像から基底を、基底から画像を反復して再構成可能とする。これにより、蓄積すべき情報はバイナリの表現係数のみとなることから、辞書のサイズに関わらず低容量化が可能になる。 【フェーズ4】ユーザの主観に合致した画質評価指標の導入による近似性能の向上: 本フェーズでは、以上のフェーズで実現される低演算量・低容量畳み込みスパース表現に対し、ユーザの主観評価に合致した画像の近似を可能とする。その結果、最新の深層学習等で求められる定式化できない指標であっても導入が可能となり、ユーザの主観に合致した画像の近似が期待できる。また、本フェーズでは以上で実現される技術を、符号化・復元・超解像等へ応用することで、ユーザの主観評価が高くなるような再構成画像の取得を可能にする。
|
次年度使用額が生じた理由 |
本研究では、高速最近傍探索の導入による低演算化を実現することから、その最大性能を評価するためのワークステーション等が必要であったが、本年度の研究において多様な分野への応用が可能であることが明らかになり、それらの分野に対応可能な、より性能の高いモデルを検討することとした。したがって、次年度使用とし、本年度の研究については自主財源で既に保持している機器の利用を行った。 また、コロナウィルスの影響による出張の延期等が生じたため、成果発表の時期を移動し、旅費等を次年度使用とする予定である。
|