1998 Fiscal Year Annual Research Report
マルチスケール解析に基づく一般画像中の文字列抽出手法の研究
Project/Area Number |
09750477
|
Research Institution | The University of Tokyo |
Principal Investigator |
本谷 秀堅 東京大学, 大学院・工学系研究科, 助手 (60282688)
|
Keywords | コンピュータビジョン / 文字認識 / パターン認識 / 形状解析 / マルチスケール / 初期視覚 / 形状記述 / 画像認識 |
Research Abstract |
本研究の目的は、一般の画像中より文字を抽出する手法を開発することである。文字は、局所的には線図形であるが大局的には塊状の図形であることが多い。そこで、画像中の図形の局所的な形状および大局的な形状を捉える手法を開発し、局所的には線・大局的には塊であるような図形を抽出することを考えた。 昨年度は、画像をガウス関数でぼかし、その分散を変化させたときの画像の変化に着目することで、図形の局所的形状および大局的形状の双方を捉える手法を提案した。 今年度は、昨年度提案した手法の数理的研究を継続して行ない、さらに、実画像を用いた実験により本手法の特性の解析を行なった。今年度の研究により新たに得られた知見をまとめると、次のようになる。 1. 実画像を用いた実験により、画像中の線図形はガウス関数によるぼかしにより変形することが確認された。この現象に関する数理的考察により、この線図形の変形が各位置における曲線の曲率の大きさに依存することを導出した。また変形の「速度」はぼかしの程度が進むに連れて大きくなることも分かった。 2. 画像のぼかしにより文字図形の局所・大局の階層構造を捉えるためには、上記「線図形の変形」を考慮する必要がある。線図形の移動方向、および移動速度を考慮した、図形形状の階層的記述手法を開発し、コンピュータに実装した。 3. 本手法により、画像中の文字を、その大きさとともに抽出することができることを確認した。本手法の特性を調べた結果、漢字など複雑な形状を持つ文字の抽出率は高いが、数字の1やアルファベットのSのように単純な形状の文字の抽出率が低いことが分かった。単純な形状の文字を抽出するには、その形状以外の特徴を併用する必要がある。文字認識などより高次の処理との件用をいかに行なうかが今後の課題である。 本研究の目的である、一般画像中の文字自動認識のための、文字図形抽出手法を提案することができた。今後は文字認識などの高次の処理を組み合わせ、より動的で頑健なシステムを構築することが課題になるであろうと考える。
|
Research Products
(6 results)
-
[Publications] H.Hontani,M.Nakao,K.Deguchi: "A Figure Splitting Method Based on the Multi-Resolution Skeleton" Proc.of International Symposium on Mathematical Morphology. 140-154 (1998)
-
[Publications] 本谷秀堅、出口光一郎: "濃淡画像の多重解像度解析に基づく図形に固有な形状および大きさの抽出法" 情報処理学会論文誌. vol.39,No.11. 1722-1731 (1998)
-
[Publications] H.Hontani,K.Deguchi: "Multi-Scale Image Analysis for Detection of Characteristic Component Figure Shapes and Size" Proc.of 14th International Conference on Pattern Recognition. 1470-1472 (1998)
-
[Publications] 本谷秀堅、出口光一郎: "画像濃淡を表す曲面の主曲率に着目したマルチスケール形状記述手法" 画像の認識・理解シンポジウム. 307-312 (1998)
-
[Publications] 本谷秀堅、出口光一郎: "局所的平滑化による輪郭線図形の形状変化について" 情報処理学会コンピュータビジョンとイメージメディア研究報告. 98-CVIM-112. 49-56 (1998)
-
[Publications] 泉谷 忠寛、本谷秀堅、出口光一郎: "濃淡勾配の局所的一様性に着目した非等方的拡散による画像記述手法" 情報処理学会コンピュータビジョンとイメージメディア研究報告. 98-CVIM-114. 81-88 (1999)