• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

マルチスケール解析に基づく一般画像中の文字列抽出手法の研究

研究課題

研究課題/領域番号 09750477
研究種目

奨励研究(A)

配分区分補助金
研究分野 計測・制御工学
研究機関東京大学

研究代表者

本谷 秀堅  東京大学, 大学院・工学系研究科, 助手 (60282688)

研究期間 (年度) 1997 – 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
2,000千円 (直接経費: 2,000千円)
1998年度: 1,100千円 (直接経費: 1,100千円)
1997年度: 900千円 (直接経費: 900千円)
キーワードコンピュータビジョン / 文字認識 / パターン認識 / 形状解析 / マルチスケール / 初期視覚 / 形状記述 / 画像認識
研究概要

本研究の目的は、一般の画像中より文字を抽出する手法を開発することである。文字は、局所的には線図形であるが大局的には塊状の図形であることが多い。そこで、画像中の図形の局所的な形状および大局的な形状を捉える手法を開発し、局所的には線・大局的には塊であるような図形を抽出することを考えた。
昨年度は、画像をガウス関数でぼかし、その分散を変化させたときの画像の変化に着目することで、図形の局所的形状および大局的形状の双方を捉える手法を提案した。
今年度は、昨年度提案した手法の数理的研究を継続して行ない、さらに、実画像を用いた実験により本手法の特性の解析を行なった。今年度の研究により新たに得られた知見をまとめると、次のようになる。
1. 実画像を用いた実験により、画像中の線図形はガウス関数によるぼかしにより変形することが確認された。この現象に関する数理的考察により、この線図形の変形が各位置における曲線の曲率の大きさに依存することを導出した。また変形の「速度」はぼかしの程度が進むに連れて大きくなることも分かった。
2. 画像のぼかしにより文字図形の局所・大局の階層構造を捉えるためには、上記「線図形の変形」を考慮する必要がある。線図形の移動方向、および移動速度を考慮した、図形形状の階層的記述手法を開発し、コンピュータに実装した。
3. 本手法により、画像中の文字を、その大きさとともに抽出することができることを確認した。本手法の特性を調べた結果、漢字など複雑な形状を持つ文字の抽出率は高いが、数字の1やアルファベットのSのように単純な形状の文字の抽出率が低いことが分かった。単純な形状の文字を抽出するには、その形状以外の特徴を併用する必要がある。文字認識などより高次の処理との件用をいかに行なうかが今後の課題である。
本研究の目的である、一般画像中の文字自動認識のための、文字図形抽出手法を提案することができた。今後は文字認識などの高次の処理を組み合わせ、より動的で頑健なシステムを構築することが課題になるであろうと考える。

報告書

(2件)
  • 1998 実績報告書
  • 1997 実績報告書
  • 研究成果

    (12件)

すべて その他

すべて 文献書誌 (12件)

  • [文献書誌] H.Hontani,M.Nakao,K.Deguchi: "A Figure Splitting Method Based on the Multi-Resolution Skeleton" Proc.of International Symposium on Mathematical Morphology. 140-154 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 本谷秀堅、出口光一郎: "濃淡画像の多重解像度解析に基づく図形に固有な形状および大きさの抽出法" 情報処理学会論文誌. vol.39,No.11. 1722-1731 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] H.Hontani,K.Deguchi: "Multi-Scale Image Analysis for Detection of Characteristic Component Figure Shapes and Size" Proc.of 14th International Conference on Pattern Recognition. 1470-1472 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 本谷秀堅、出口光一郎: "画像濃淡を表す曲面の主曲率に着目したマルチスケール形状記述手法" 画像の認識・理解シンポジウム. 307-312 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 本谷秀堅、出口光一郎: "局所的平滑化による輪郭線図形の形状変化について" 情報処理学会コンピュータビジョンとイメージメディア研究報告. 98-CVIM-112. 49-56 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 泉谷 忠寛、本谷秀堅、出口光一郎: "濃淡勾配の局所的一様性に着目した非等方的拡散による画像記述手法" 情報処理学会コンピュータビジョンとイメージメディア研究報告. 98-CVIM-114. 81-88 (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 本谷秀堅、出口光一郎: "マルチスケール解析に基づく文字領域抽出手法" 電子情報通信学会技術研究報告. PRMU96-180. 1-8 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 中尾学、本谷秀堅、出口光一郎: "スケルトンの抽出と階層化による輪郭線図形の多重解像度解析" 情報処理学会研究報告. 97-CVIM-104. 1-8 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 本谷秀堅、出口光一郎: "画像のスケールスペース解析にもとづく線図形の抽出" 情報処理学会研究報告. 97-CVIM-105. 9-16 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 本谷秀堅、出口光一郎: "図形形状の多重解像度解析とdeep structureの抽出" 第2回「印象の工学」ワークショップ予稿集. 35-42 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] H.Hontani, M.Nakao, K.Deguchi: "A Figure Splitting Method Based on the Multi-Resolution Skeleton" Proc.of International Symposium on Mathematical Morphology. (印刷中). (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] B.Haar Romeny et al.(共著): "Scale-Space Theory in Computer Vision" Springer-Verlag, 374 (1997)

    • 関連する報告書
      1997 実績報告書

URL: 

公開日: 1997-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi