研究課題/領域番号 |
23700262
|
研究機関 | 東京大学 |
研究代表者 |
寺園 泰 東京大学, 情報理工学(系)研究科, 研究員 (90435785)
|
キーワード | モーメント / 統計量 / 共分散行列 / テクスチャ / 連続写像 |
研究概要 |
本研究では,特に画像や音声といった我々が普段観察している信号について,n 次モーメントがどのように情報を担っているか,またどのように特徴が記述できるか明らかにすることを目的の一つとしている.二年度目となる今年度は,情報復元の観点から,画像のモーメントについて更なる検討を試みた.多数の画像情報を効率的に格納するために,それら画像群から比較的少数の画像テンプレートを求めることは良く行われる.元の画像はテンプレートの線形結合等で表現され,個々の画像は,画像自体でなく結合係数のみを記録すればよいため,圧縮が達成される.こうした圧縮・復元について,モーメントの利用による新たな方法論を検討した.まず,画像一枚を行ベクトルとし,多数の画像の行ベクトルを縦に並べた画像行列を考え,その2次モーメントつまり分散共分散行列の対角性を調べた.Brodatz のテクスチャデータベースの場合,全成分の絶対値の平均に対する対角成分の平均は,元画像の行列では約 40 倍,ガウシアンランダム行列を変換行列として生成したテンプレート画像行列では約 5.7 倍であった.すなわち,元画像では対角成分に集約されていた情報が,変換によって非対角成分まで滲出したと言える.重要なのは,逆に,元の画像情報の特徴として,分散京分散行列の対角性を仮定できると確認できたことである.この対角成分は非負であるため,さらに非負性を制約として利用可能である.これらの制約条件を利用して最適化問題を解くことで,元画像のモーメント情報を直接的に復元する新たな枠組みと出来る可能性を得た.その際に用いる評価関数の検討等は今後の課題として挙げられる. 提出中の Berge の最大値の定理の関連定理の論文は現在修正中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度主に予定していたのは,前年度に引き続き,n 次モーメントによる画像・音声等の特徴記述の検討と,モーメントを利用した信号処理の可能性の検討,そしてデータ自体の性質の検討などである.画像情報の圧縮と復元については,変換前後の画像行列の分散共分散行列の性質の検討から,モーメントを利用した方法にとって有効な前提が実データについて確認でき,方法の枠組みが得られた.計画している多重解像度解析との組み合わせによって,さらに有効な議論に進展する見通しである.また,前年度予定以上に進んだ劣決定問題に関する側面について,投稿していた論文は,現在査読結果に基づき改訂中で,完了次第提出の予定である.
|
今後の研究の推進方策 |
これまでの検討結果を踏まえ,更なる実データ適用と手法の開発および理論的展開を目指す.実データに関しては,既存のデータベースを中心とするが,可能な場合自ら計測・取得した実世界データも適用対象とする.手法の開発および理論的展開については,これまでの2次モーメントに関する検討結果からさらに高次のモーメントへ検討を発展させること,及び元データを分割や多重解像度解析等により複数の表現を持たせ,1サンプル(1オブジェクト)についてモーメントベクトルを生成して表現空間とすることを主な項目として検討を推進する.
|
次年度の研究費の使用計画 |
学会・研究会・論文投稿への研究費の使用は研究の進展に応じて行う.これに加え,実世界のマルチモーダルな情報を取得するための計測・記録装置・作業力を研究の進展に応じて用意ないし増強する.また,大規模なデータに関する最適化問題等を行えるよう,計算機に高度な演算能力(主記憶・補助記憶・GPGPU等)を備えるための拡張または新規導入を,研究の進展に応じて行う.
|