異なる機会に入力された画像は入力環境条件の違いにより、同じ対象の画像であっても、濃度値のみならず拡大率や方向も変化する。このような条件下においても画像を認識する方法を提案する。そのため、画像の2次元パワースペクトルより得られる回転および拡大不変量を使う。対象としては、パワースペクトルでの記述が適当なテクスチャ画像とする。回転不変量は、2、4、6、8次のスペクトルモーメントより得られるものを使う。これらモーメントの中には、動径方向の分布のみを反映するものと、角度方向の分布も含むものがあり、使用目的のテクスチャパターンにより選ぶことができる。モーメントを直接画像で求めると画像周辺の濃度値が大きく計算が不安定になるが、スペクトルに用いるとパワーは原点付近に集中し安定な結果が得られる。次に拡大に対応するために、回転不変量の適当なベキ乗の比をとることにより、回転かつ拡大不変量が得られる。この比をとることは拡大不変量を得ると同時に、スペクトルモーメントの計算誤差を打ち消す役割をもっている。 実際のテクスチャ画像を使った実験により以下の結果を得た。8個の不変量を使うことにより、回転と拡大のあるテクスチャ画像16種類の分類が、拡大率2倍の範囲で、100パーセント正確にできた。この応用として、工業製品の欠陥検査に使うことを試した。ここでは、布地に虫食いの欠陥のある画像を欠陥のない布地と区別する実験をした。その結果、ある程度欠陥が大きいとき、たとえば画像の面積の10分の1程度のとき、欠陥の検出に成功した。
|