1999 Fiscal Year Annual Research Report
Project/Area Number |
11750313
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
長井 隆行 電気通信大学, 大学院・電気通信学研究科, 助手 (40303010)
|
Keywords | 画像符号化 / フィルタバンク / ウェーヴレット / 重要領域の抽出 |
Research Abstract |
本研究は、画像(静止画・動画)中の重要な領域を自動抽出し、その領域をより精細に符合化する技術の確立を目的としている。本年度は、このための基礎的項目として以下の様な実験を行った。 1.ベースとなる画像符号化の性能向上 フィルタバンク(ウェーヴレット)を用いたサブバンド符号化では、低ビットレートの時、画像のエッジ部分でリンギングと呼ばれる目障りな歪を生じる。これは高周波数側の基底が長いことが原因である。プロッキングを低減させるためには、低周波数側の基底は長くする必要があるため、本研究では周波数帯域によって基底長を変えることのできる新しいフィルタバンクの構造と設計法を提案し、画像符号化への応用において有効であることを示した。 2.重要領域を考慮した画像符号化手法の開発 上記のフィルタバンクをSPIHT符号化に用い、さらに抽出した重要領域を重み付け(重要領域のビットをシフト)することにより重要領域を考慮した画像符号化を実現した。実際の画像において、主観的品質の良い復号画像が得られることを確認した。 3.重要領域の定義と抽出法 現在のところ、重要領域は顔(特に画像の中心に近いもの)とし、色による抽出及び、固有空間を用いた抽出を検討した。また動画でステレオ音声が利用できる場合、話者の方向をある程度特定できれば顔抽出の際に非常に有用であると考えられるため、マイクロフォン対を用いた話者方向推定手法を検討した。 来年度の課題としては以下が挙げられる。 1.重要領域の抽出手法の更なる検討 音声を組み合わせた抽出法の具体化、ユーザの視線検出による抽出法、顔以外の重要領域の定義と抽出など。 2.符号化アルゴリズムの性能向上 フィルタバンク(ウェーヴレット)の改良等によりさらなる符号化性能の向上が期待できる。 3.領域抽出と符号化アルゴリズムの統合 最終的に、これらを統合する必要がある。
|