• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

文字領域推定を行わない情景画像中の文字認識アルゴリズムの構築

研究課題

研究課題/領域番号 26540124
研究機関東北大学

研究代表者

和泉 勇治  東北大学, 情報科学研究科, 准教授 (90333872)

研究期間 (年度) 2014-04-01 – 2016-03-31
キーワード文字認識 / 輪郭線 / 情景画像 / 畳み込みニューラルネットワーク
研究実績の概要

本研究課題は,認識的処理を可能な限り排除した情景画像中の文字認識アルゴリズムの構築を目的としている.情景画像中の文字認識技術は,画像中の文字領域推定と推定領域の字種判別の2段階の認識処理により実現されることが多い.本研究課題では,文字領域推定やストローク推定などの認識的処理を可能な限り排除し,画像中の文字の字種を判断する新しい文字認識アルゴリズムの構築を目的とし,画像から抽出される全特徴量を抽出し,その特徴量の分布から直接字種を決定するモデルを提案した.更に,背景部分が認識対象に対しノイズとして働くことを指摘し,それを効率的に排除するための畳み込みニューラつネットワークを利用した特徴選択についても提案した.
特徴量の分布から直接認識するモデルに関しては,画像中に存在する全ての閉曲線からその輪郭を特徴量とし,隣接する輪郭間の位置関係,大きさなどを定量的に評価するスコアを提案した.この全ての閉曲線を認識対象とする方式により,画像中の文字領域の推定処理を排除した認識アルゴリズムを構築することが出来た.認識精度に関しては,ICDAR2003のデータセットによる評価を行い既存研究と同等の認識精度を達成可能であることを確認した.しかし,輪郭線の抽出ミスによる認識漏れが存在し,より適切な画像処理や,複数の輪郭線抽出などを組み合わせることなどが必要であると判明した.
また,一部の輪郭に背景の輪郭がノイズとして入り込み,適切に形状を評価出来ない問題点が明らかとなった.この問題に対し,文字画像と非文字画像を学習した畳込みニューラルネットワークを利用したフィルタ処理を適用し,ノイズの提供により誤認識の軽減を実現した.

  • 研究成果

    (1件)

すべて 2016

すべて 雑誌論文 (1件) (うち査読あり 1件)

  • [雑誌論文] On Demand Color Calibration for Pedestrian Tracking in Non-overlapping Fields of View2016

    • 著者名/発表者名
      Yuji Waizumi, Masako Omachi, Kazuyuki Tanaka
    • 雑誌名

      IEEE Internet of Things Journal

      巻: in press ページ: in press

    • 査読あり

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi