視覚的に自然な高圧縮映像符号化手法の開発を目指して様々なアプローチで研究を行った。特に高圧縮時に視認性を損なう、ブロックノイズやモスキートノイズをいかに軽減するかについて検討した。まずスパースコーディングに基づく手法を検討した。画像を、離散コサイン変換ではなくスパースコーディングの基底で表現することにより、対象としている画像や映像により特化した表現が可能となり、ノイズの低減が期待できる。映像を対象とし、最初のフレームから基底を作成し、その基底を用いて後のフレームを表すことにより、その映像に特化した基底を用いて符号化を行う手法を開発し、実際の映像を用いて効果を確認した。また、ブロックノイズが発生しやすいテキストを含む画像を対象とし、テキスト領域とその他の領域を識別し、各領域に特化した基底で画像を表現することでノイズを軽減する手法も開発した。一方で、デブロッキングフィルタを用いて映像のノイズを削減する手法についても検討した。畳み込みニューラルネットワークを用いて画像のパッチを学習し、ブロック分割された各領域の境界を含む画像をニューラルネットワークに入力することで、ブロックノイズを軽減した画像を生成する手法を開発した。さらに、任意形状のオブジェクトを抽出し、オブジェクトと背景で異なる符号化手法を用いることで、効率良い符号化を実現する手法も開発した。これらの成果は国際学会および国内学会で発表した。
|