研究分担者 |
MUSMANN H. ハノーバー大学, 教授
JUDICE C. Bell Atlantic研究所, 研究員
KUNT M. ローザンヌ連邦工科大学, 教授
CHIARIGLIONE エル CSELT, Head of ID
小舘 亮之 日本学術振興会, 特別研究員
児玉 明 早稲田大学, 理工学部, 助手 (50277828)
安田 浩 早稲田大学, 理工学部, 客員教授
小松 尚久 早稲田大学, 理工学部, 助教授 (30195846)
相沢 清晴 東京大学, 工学部, 助教授 (20192453)
田崎 三郎 愛媛大学, 工学部, 教授 (00036394)
酒井 善則 東京工業大学, 工学部, 教授 (70196054)
安田 靖彦 早稲田大学, 理工学部, 教授 (40013106)
JOZAWA Hirohisa NTT Corp.
YABUSAKI Masami NTT DoCoMo Inc.
MIKI Toshio NTT DoCoMo Inc.
SAKURAI Yasuhisa Tokyo Women's Medical University
FUKUDA Toshio University of Nagoya
ALGAZI V. University of California, Davis Prof.
SHAFER R. HHI,Dr.
KOMIYA Kazumi Kanagawa Institute of Technology
ALGAZI V カリフォルニア大学, Davis校, 教授
PROF.H. Musm ハノーバー大学, 教授
SHAFER R. HHI, 主任研究員
羽鳥 光俊 東京大学, 工学部, 教授 (60010790)
原島 博 東京大学, 工学部, 教授 (60011201)
辻井 重男 中央大学, 工学部, 教授 (50020350)
花村 剛 早稲田大学, 理工学部, 助手 (60247228)
|
研究概要 |
前年度の活動の成果として得られた、シンタックス、ツール、アルゴリズム、プロファイルという4つの異なる要素から構成するフレームワークを基本構造とし、今年度は,主に,具体的要素技術の比較および評価,確認実験モデルの作成,動画像ドキュメントアーキテクチャの概念に基づく符号化方式の具体化作業を行なった。 まず、具体的要素技術の比較評価テストについて。Functionality、テスト画像クラス、ビットレートによって評価対象を分類し、比較評価テストを行なった。ただし、テストの際、基準となる比較対象(アンカー)として、CIFフォーマットを用いたMPEG1およびCIFあるいはQCIFを用いたH.263を使用した。比較評価の結果、10kbpsを中心とした低ビットレート範囲ではビットレートが高くなるほどアンカーおよびブロックベース手法の結果が良好であること、低ビットレートにおいてはフレームレートの設定がその画質評価結果を大きく左右する要因であること、Content based functionaliesを有する方式はアルゴリズムの種類が増大し要素としての評価が難しい傾向を示すこと、が主に明らかとなった。良好な性能を示す要素技術の候補としては、long term memory, short term memoryを併用する手法、イントラフレームにウェーブレットを適用する手法、グローバル動き補償とローカルアフィン動き補償の組合わせ、ブロック分割手法、matching pursuits手法等が挙げられた。 次に、確認実験モデルの作成について。長期に渡る議論の結果、確認実験モデルとしてはビテオオブジェクト平面という概念で表される複数のビテオコンテントを入力情報源として適用可能なモデルが選択された。この確認モデルは、H.263の拡張動きベクトルおよびアドバンスト予測方式を採用すること、2値形状は4分木符号化、多値形状は4分木符号化+VQを使用すること、コンテント境界はpaddingを行って符号化することを主な条件として作成されることとなった。 最後に、動画像ドキュメントアーキテクチャの概念に基づく符号化方式の具体化について。メディアの統合的扱いが可能なフォーマットおよび既存データの再利用機能が将来のマルチメディア情報環境において特に重要であるという観点から、文書の編集加工処理を構造的に行なうデータアーキテクチャであるODAの概念をビデオ・ドキュメントアーキテクチャ(VDA)として動画像符号化への適用を試みた。 まず、ビデオコンテントをカメラの光軸に垂直な単一の静止平面(背景のみ)と仮定しこれを入力としてカメラパラメータを分離符号化する方式を検討した。続いて、αマップと原画像情報を入力として、VDAの概念に基づいたプロセッサブル符号化方式を検討した(H.263を基本とし、任意形状に対応した直交変換、αマップ符号化、コンテント・時間単位データ多重化を主に加えた構成)。実験の結果、前者の方式は正確なカメラパラメータが計測できる場合約50[dB]の平均SNRで複号化できる能力をもち、検出するパラメータ誤差が蓄積するに従ってこの値が急激に減少する傾向を子示すことが分かった。また、攻守の方式については、カメラ操作およびビデオコンテントの移動・消去・表示優先度・追加等の編集シミュレーションを行ない、意図した動画像の編集加工機能・データ再利用機能がVDAモデルにより効果的に実現されていることを確認した。また、簡単な加工用データ操作記述言語を試作することにより、編集処理の迅速性、内容の可読性が大きく向上されることを示した。 今後は、画像合成を行なう際のMapping処理の高速化、ビテオコンテントのデータのバッファリング処理、透明度を考慮したαマップ符号化、ランダムアクセス機能の実現手法・ドキュメントアーキテクチャの概念で扱えるメディア範囲の拡張などが課題として挙げられた。
|