• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1997 年度 実績報告書

マルチスケール解析に基づく一般画像中の文字列抽出手法の研究

研究課題

研究課題/領域番号 09750477
研究機関東京大学

研究代表者

本谷 秀堅  東京大学, 大学院・工学系研究科, 助手 (60282688)

キーワードコンピュータビジョン / 文字認識 / パターン認識 / 形状解析 / マルチスケール / 初期視覚 / 形状記述 / 画像認識
研究概要

本研究では、一般の画像中に含まれる文字を自動認識するために必要な、汎用の文字図形抽出方法を開発する。具体的にはマルチスケール解析を応用することで画像中の図形の局所的な形状と大局的な形状とを捉え、局所的形状と大局的形状の違いを利用して文字候補図形を抽出する。
今年度は上記手法実現のための、数理的研究および予備実験を行なった。今年度の研究により新たに得られた知見をまとめると、次のようになる。対象画像は、一般的な濃淡画像とした。
1.画像より捉えられる図形形状は、図形を観測する際のスケールに依存する。一般に図形の大きさは未知であるため、対象図形の局所的な形状および大局的な形状を捉えるためには、その図形にとっての局所的および大局的とはどの程度のスケールのことなのかを図形自身より求める必要がある。これら形状観測に適したスケールを求めつつ図形形状を捉えるために、まず画像を等方的なガウス関数によりぼかすことにした。さらにぼかしの際のスケールを変化させる。スケールの変化に対する画像の変化を、画像の濃淡を表す曲面の主曲率の変化により記述することで、画像中の各図形を観測するのに適したスケールを求めつつその形状を捉えることが出来ることを見い出した。
2.1.の考察に基づき、濃淡画像中の各図形の局所および大局の形状抽出を行なうプログラムをコンピュータにインプリメントし、様々な濃淡画像を対象として実験を行なった。この結果、画像中の各図形の形状をその大きさとともに求めることができ、さらに局所的に線図形であり大局的には塊状である図形を画像より抽出することにより、文字候補図形を抽出することができた。

  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 本谷秀堅、出口光一郎: "マルチスケール解析に基づく文字領域抽出手法" 電子情報通信学会技術研究報告. PRMU96-180. 1-8 (1997)

  • [文献書誌] 中尾学、本谷秀堅、出口光一郎: "スケルトンの抽出と階層化による輪郭線図形の多重解像度解析" 情報処理学会研究報告. 97-CVIM-104. 1-8 (1997)

  • [文献書誌] 本谷秀堅、出口光一郎: "画像のスケールスペース解析にもとづく線図形の抽出" 情報処理学会研究報告. 97-CVIM-105. 9-16 (1997)

  • [文献書誌] 本谷秀堅、出口光一郎: "図形形状の多重解像度解析とdeep structureの抽出" 第2回「印象の工学」ワークショップ予稿集. 35-42 (1997)

  • [文献書誌] H.Hontani, M.Nakao, K.Deguchi: "A Figure Splitting Method Based on the Multi-Resolution Skeleton" Proc.of International Symposium on Mathematical Morphology. (印刷中). (1998)

  • [文献書誌] B.Haar Romeny et al.(共著): "Scale-Space Theory in Computer Vision" Springer-Verlag, 374 (1997)

URL: 

公開日: 1999-03-15   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi