1997 Fiscal Year Annual Research Report
マルチスケール解析に基づく一般画像中の文字列抽出手法の研究
Project/Area Number |
09750477
|
Research Institution | The University of Tokyo |
Principal Investigator |
本谷 秀堅 東京大学, 大学院・工学系研究科, 助手 (60282688)
|
Keywords | コンピュータビジョン / 文字認識 / パターン認識 / 形状解析 / マルチスケール / 初期視覚 / 形状記述 / 画像認識 |
Research Abstract |
本研究では、一般の画像中に含まれる文字を自動認識するために必要な、汎用の文字図形抽出方法を開発する。具体的にはマルチスケール解析を応用することで画像中の図形の局所的な形状と大局的な形状とを捉え、局所的形状と大局的形状の違いを利用して文字候補図形を抽出する。 今年度は上記手法実現のための、数理的研究および予備実験を行なった。今年度の研究により新たに得られた知見をまとめると、次のようになる。対象画像は、一般的な濃淡画像とした。 1.画像より捉えられる図形形状は、図形を観測する際のスケールに依存する。一般に図形の大きさは未知であるため、対象図形の局所的な形状および大局的な形状を捉えるためには、その図形にとっての局所的および大局的とはどの程度のスケールのことなのかを図形自身より求める必要がある。これら形状観測に適したスケールを求めつつ図形形状を捉えるために、まず画像を等方的なガウス関数によりぼかすことにした。さらにぼかしの際のスケールを変化させる。スケールの変化に対する画像の変化を、画像の濃淡を表す曲面の主曲率の変化により記述することで、画像中の各図形を観測するのに適したスケールを求めつつその形状を捉えることが出来ることを見い出した。 2.1.の考察に基づき、濃淡画像中の各図形の局所および大局の形状抽出を行なうプログラムをコンピュータにインプリメントし、様々な濃淡画像を対象として実験を行なった。この結果、画像中の各図形の形状をその大きさとともに求めることができ、さらに局所的に線図形であり大局的には塊状である図形を画像より抽出することにより、文字候補図形を抽出することができた。
|
Research Products
(6 results)
-
[Publications] 本谷秀堅、出口光一郎: "マルチスケール解析に基づく文字領域抽出手法" 電子情報通信学会技術研究報告. PRMU96-180. 1-8 (1997)
-
[Publications] 中尾学、本谷秀堅、出口光一郎: "スケルトンの抽出と階層化による輪郭線図形の多重解像度解析" 情報処理学会研究報告. 97-CVIM-104. 1-8 (1997)
-
[Publications] 本谷秀堅、出口光一郎: "画像のスケールスペース解析にもとづく線図形の抽出" 情報処理学会研究報告. 97-CVIM-105. 9-16 (1997)
-
[Publications] 本谷秀堅、出口光一郎: "図形形状の多重解像度解析とdeep structureの抽出" 第2回「印象の工学」ワークショップ予稿集. 35-42 (1997)
-
[Publications] H.Hontani, M.Nakao, K.Deguchi: "A Figure Splitting Method Based on the Multi-Resolution Skeleton" Proc.of International Symposium on Mathematical Morphology. (印刷中). (1998)
-
[Publications] B.Haar Romeny et al.(共著): "Scale-Space Theory in Computer Vision" Springer-Verlag, 374 (1997)