2012 Fiscal Year Research-status Report
時間領域予測を用いた画面内符号化アルゴリズムに関する研究
Project/Area Number |
24700048
|
Research Institution | The University of Tokushima |
Principal Investigator |
宋 天 徳島大学, ソシオテクノサイエンス研究部, 准教授 (10380130)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | 画面内予測 |
Research Abstract |
本研究では、高圧縮率を実現する新たな動画像符号化アルゴリズムを提案する。今まで幅広く使用されている動画像符号化国際標準H.264/AVC の基本アルゴリズムをベースに、時間領域と空間領域の特徴を併用することにより、冗長性を更に削減できるアルゴリズムを新規開発し、符号化効率を大幅に向上する。この研究成果を利用し、必要な検証を行ったうえ、次世代の動画像符号化国際標準に提案できるものと考える。 先行研究の実験結果により、隣接フレームの画素を用いた空間予測に使用することは有効であることが証明され、この斬新な予測方法は必ず高い圧縮率の実現につながると予測できる。しかし、実験に用いた参照ブロックの選択、参照画素の選択、予測ブロックの作成方法は、従来の方法を流用したものであり、それぞれは最適な方法であると言えず、最高な圧縮率を引き出せるための細部に渡る調査が必要となる。 本研究は隣接フレームの画素を用いた空間予測手法を用いて、参照ブロックの選択、参照画素の選択、予測ブロックの作成方法を改良することにより、符号化のパターンを覚えるにはさらにビット数が必要であるため、そのパターン数を限定することにした。実験結果により、この制限を加えた場合平均10%以上の性能向上が見られた。この評価の結果より、提案手法は実用的なものであり、従来の画面内符号化手法と比較評価ができるようになった。ここまでの研究成果をまとめ、国際会議で論文を発表した。また、本手法の性能をさらに向上するため、現画像の性質により、画像符号化の手法を変える手法を提案している。そのため、現画像の特徴を捉えるための手法を開発し、その検証を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は隣接フレームの画素を用いた空間予測手法を用いて、参照ブロックの選択、参照画素の選択、予測ブロックの作成方法を改良することにより、平均20%以上の圧縮率向上を目指しているが、現在では10%以上の向上を達成している。 先行研究の検証結果により、連続フレームの同位置のブロックは連続的にイントラモードに符号化される確率が高いため、先行研究に使用された手法では前フレームの同位置のブロックがイントラモードで符号化された場合に限定している。また、参照ブロックの選択については、最多数のモードで符号化されたブロックのみを候補ブロックとしている。この二つの制限があるため、演算量の増加を抑えているが、最適な予測ブロックが選択されてない場合がある。動き探索を行う際に、前フレームにあるもっとも近似するブロックを探索しているため、先行研究ではその結果の一部の使用を試みた。その結果は良い性能を示しているが、新たな動き情報を符号化する必要があるため、圧縮性能が劣化する場合がある。動きベクトルの符号化手法について、動き探索中心から予測することにより、動きベクトルの符号量の削減を試みた。しかし、やはり参照フレームにイントラブロックの数が多く、参照できる動きベクトルが少ないので参照精度が低い。また、参照画素の選択について、現手法では単純に参照ブロック間の差分を取り、差分の小さいブロックを選択している。しかし、選択されるブロックの画素を用いて参照ブロックを再構築する場合、参照ブロック全体の特性が予測性能を左右するため、参照ブロックの特性を正しく反映する手法で選択すべきと考える。そのため、一つのブロックの画素を交互に分離し、四つの画素ブロックを作成する。この四つのブロックの差分により、参照ブロックの特性を量的に評価する手法を提案する。この手法は有効であることが証明され、現在も検証を進めている。
|
Strategy for Future Research Activity |
選択された参照ブロックの画素を用いて、複数の方向の参照を行う必要があるため、参照ブロックの各方向の画素値の分散を用い、符号化ブロックの相応方向の分散と比較することにより、参照ブロックを正確に選択することが可能と考え、その実装と検証を行う。分散値を用いても精度が不十分である場合、他の評価基準と組み合わせる方法で補う。ただし、演算量の大幅な増加を避けるため、できるだけ簡易な方法を採用する。 また、現在HEVCに提案されているイントラ符号か手法、特にイントラ予測の方向を増やすことで多くの参照パターンを作成する方法は非常に有効であるため、本手法にも類似の方法を導入したいと考えている。しかし、そのまま導入すると演算量が大幅に増加するのみならず、並列処理性能を劣化させるので、現在提案している手法をベースに、多方向の予測データを新たに作成する手法を提案する予定である。本研究の直接の目的ではないが、提案手法をGPUに実装した場合の処理速度を評価し、提案手法の並列処理性能も評価していく予定である。 以上の改良を行ってから、本研究の提案手法とHEVC の提案を比較し、その優劣を分析する。HEVC に提案された複数の空間予測に関する提案では画面内の予測のみを使用しているため、本研究の提案と根本的に異なり、それぞれの特長がある。そのため、提案手法とHEVC の提案を併用した場合、より良い性能を達成できると予測し、併用する場合の検証も行う。
|
Expenditure Plans for the Next FY Research Funding |
様々なシミュレーションを行うのは、性能の高いPCを導入する必要があるが、去年では高価のワークステーションを購入せず、GPUボート付きのPCで高速処理を目指していましたが、今年の実験内容がさらに増えるため、高性能なPCをさらに導入する予定です。複数の学生で作業を行うため、ネットワークファイルシステムを導入して作業の効率化を図る予定である。そのため、市販のNASシステムを購入する必要がある。 また、実装用と検証用のソフトウェア環境は既に入手しているが、並列処理プログラミングの記述、デバッグをスムーズに行うために、効率的なGPU 開発環境の構築が必要となる。市販のソフトウェアHMPPを購入し、効率的な開発を図っているが、C++記述のプログラムに未対応であるため、今年はopenCLのコンパイラを用いてC++のソースファイルを書きなおす予定です。そのため、関連のソフトウェアの購入し、並列処理技術のセミナーに参加し、ノーハウを積む必要があり、そのための旅費が必要である。この研究成果を海外特許獲得するために、JSTの申請を行ったが、これから国別公開まで進むとさらにJSTの支援を頂けないと行えないので、一部が研究費から支出する必要がある可能性がある。 また、積極的に学会に参加し、研究成果を公表するため、学会参加費や旅費が必要となる。また、研究が進むと同時に、論文誌に投稿するため、掲載料が必要となる。国内外の展示会や、学会の場で研究成果を広くアピールし、企業と共同で標準化活動を行う予定であるが、そのための旅費が必要である。
|
Research Products
(2 results)