研究概要 |
本年度は,画像の拡大および画像からの特徴抽出に関して主に研究を行った. 画像の拡大は,未知の画素を周辺の既知の画素から推定することにより実現される.本研究では,推定の手法としてコードブックに基づいた手法とファジィ推論に基づいた手法を提案した.コードブックに基づいた手法では,学習用の画像データを用いて自己組織化マップによりコードブックを作成する.これは,実際の画像データからコードブックを作成するので,非常に精度の高い画像拡大が可能である.しかしながら,コードブック数の増加に伴い計算量が多くなり,膨大な処理時間を要するという問題点がある.処理の高速化を図るために,自己組織化マップハードウェアの設計を行った.FPGAに実装することを前提に設計したディジタル回路では,計算機による処理と比較して約20倍の処理速度を実現した.一方,ファジィ推論に基づいた手法では,既知の周辺画素と未知の画素との関係をユーザがファジィIf-Thenルール形式で記述する.コードブックに基づく手法と比較して処理が高速であり,セミリアルタイム処理による動画像の拡大に適用した.いずれの方法も,従来の画像拡大手法と比較して,精度の高い画像拡大が実現できた. 人間は、ただ漫然とものを目に入ってきた情報を受け取っているわけではない。顔を見るときもその人の特徴を瞬時に捉え、そこを中心に見ている。そこで、人間の知覚に重要と思われる情報を画像から効率的に切り出すことを試みた。ここではThree Component Modelの概念を応用し、画像を周波数領域において分割、知覚に重要な領域のみを抽出する。結果として、非線形関数の局所近似能力に優れているウェーブレットネットワークを用い、その近似学習過程において人間の知覚に重要なStrong Edgesを生成し、効果的に知覚に重要な部分のみを切り出すことができた。また、リアルタイム処理を実現するためにFPGAを用いたウェーブレットネットワークハードウエアを設計し、良好な結果を得た。現時点では、1次元のシステムであるが、小規模で高速という特徴を活かし、ビデオレートでの画像処理への応用を進めている。
|