研究課題/領域番号 |
23700262
|
研究機関 | 東京大学 |
研究代表者 |
寺園 泰 東京大学, 情報理工学(系)研究科, 研究員 (90435785)
|
研究期間 (年度) |
2011-04-28 – 2015-03-31
|
キーワード | モーメント / 統計量 / 歪度 / 尖度 / 劣決定 / 連続写像 / テクスチャ |
研究概要 |
本研究では,特に画像や音声といった我々が普段観察している信号について,n 次モーメントがどのように情報を担っているか,またどのように特徴が記述できるか明らかにすることを目的の一つとしている.初年度となる今年度は,画像の中でも特に高次モーメントが特徴の指標となりうることが先行研究で示唆されている,テクスチャ画像について検討を試みた.テクスチャ画像のサンプルとして標準的に用いられる Brodatz のアルバムのテクスチャすべてを対象とした.まず,各画像についての統計量として,1次~4次までのモーメント(平均,分散,歪度,尖度)を計算した.次に,各々を確率変数として標準化した.その後,モーメントの分散共分散行列について主成分分析を試みた.すると,第1主成分が寄与率92% を示し,またこの第1主成分に対して,各モーメントはほぼ均等に寄与していた.すなわち,テクスチャ画像の判別には,1次から4次のモーメントは(標準化された場合)ほぼ同等の情報を担っていることが示唆された.これは,平均や分散に比べて軽視されがちな高次のモーメントについて,その重要性を示す新たな知見と言える.本研究では,また,劣決定系を信号が経由する際,元の信号やモーメントについてどのような伝達・復元が可能か検討することも目的の一つとしている.今年度は,この問題の数学的な基礎として,劣決定逆問題において,観測信号から元信号を推定する手法(=写像)が,観測信号について連続になるための十分条件と,また一定の条件下での連続な推定写像の存在性を証明した.これらの定理を述べた論文を投稿した(現在査読中).これらの定理は,経済学でよく知られた Berge の最大値の定理の応用ともいえるもので,本研究の対象とする問題のほかにも広範な問題に適用できる可能性がある.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度予定していたのは,n 次モーメントによる画像・音声等の特徴記述の基礎的検討である.これについて,実際に画像データ(今回はテクスチャの写真画像のサンプル群)に対しn次モーメントを計算し,平均や分散に比べて軽視されがちな3次や4次の高次のモーメントも画像(テクスチャ)判別に同等に貢献しうる可能性を示した点で,まず有効な知見が得られた.同時に,テクスチャは高次モーメントにその特徴を負うところが大きい,という自然界のデータの性質に関する知見が得られた.計画調書にも述べたように,画像や音声等の信号に対しモーメントを計算し,また画像や音声を何らかの空間上に変換・分割してモーメントを計算し,その特徴を探っていくことは,初年度を中心としつつも計画の全年度を通じて継続的に行っていく予定であり,その第一歩の知見を得たと言える.劣決定問題に関する信号の伝達・復元の可能性の追求は,次年度以降に主に行う予定であったが,本年度の検討が思ったより進んだため,定理を証明し,論文を投稿することができた(現在査読中).
|
今後の研究の推進方策 |
今年度行ったテクスチャ画像に関するモーメント計算をさらに進展させ,ほかのテクスチャ画像データベース(CUReT等)や,テクスチャでない画像,あるいは音声信号等についても,モーメントを計算してその特徴記述や判別への利用の可能性,データ自体の性質の考察を推し進める.とくに,画像や音声を何らかの空間上に変換・分割してモーメントを計算することについては,画像に関する多重解像度ヒストグラムの利用などが先行研究で行われていることもあり,多重解像度解析とn次モーメントとの組み合わせの有効性について検証していく.劣決定問題の信号伝達・復元については,今年度に一定以上の進展が得られたため,主に次年度以降の課題とし,調査等に重点を置く予定である.
|
次年度の研究費の使用計画 |
学会・研究会・論文投稿への研究費の使用は研究の進展に応じて行う.これに加え,画像や音声について,既存のデータベースだけでなく,自分で条件をコントロールできるデータを得るため,これらの計測・記録装置を研究の進展に応じて用意する.また,大規模データベースに対する計算を検討する場合,PCに,大規模画像・音声データ処理に適した高度な演算能力(主記憶・補助記憶・GPGPU等)を持たせるため,研究の進展に応じて拡張または購入する.
|