本研究では、一般の画像中に含まれる文字を自動認識するために必要な、汎用の文字図形抽出方法を開発する。具体的にはマルチスケール解析を応用することで画像中の図形の局所的な形状と大局的な形状とを捉え、局所的形状と大局的形状の違いを利用して文字候補図形を抽出する。 今年度は上記手法実現のための、数理的研究および予備実験を行なった。今年度の研究により新たに得られた知見をまとめると、次のようになる。対象画像は、一般的な濃淡画像とした。 1.画像より捉えられる図形形状は、図形を観測する際のスケールに依存する。一般に図形の大きさは未知であるため、対象図形の局所的な形状および大局的な形状を捉えるためには、その図形にとっての局所的および大局的とはどの程度のスケールのことなのかを図形自身より求める必要がある。これら形状観測に適したスケールを求めつつ図形形状を捉えるために、まず画像を等方的なガウス関数によりぼかすことにした。さらにぼかしの際のスケールを変化させる。スケールの変化に対する画像の変化を、画像の濃淡を表す曲面の主曲率の変化により記述することで、画像中の各図形を観測するのに適したスケールを求めつつその形状を捉えることが出来ることを見い出した。 2.1.の考察に基づき、濃淡画像中の各図形の局所および大局の形状抽出を行なうプログラムをコンピュータにインプリメントし、様々な濃淡画像を対象として実験を行なった。この結果、画像中の各図形の形状をその大きさとともに求めることができ、さらに局所的に線図形であり大局的には塊状である図形を画像より抽出することにより、文字候補図形を抽出することができた。
|