• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

文字領域推定を行わない情景画像中の文字認識アルゴリズムの構築

研究課題

研究課題/領域番号 26540124
研究機関東北大学

研究代表者

和泉 勇治  東北大学, 情報科学研究科, 准教授 (90333872)

研究期間 (年度) 2014-04-01 – 2016-03-31
キーワード文字認識 / 画像中の文字認識 / 文字領域推定 / シェープコンテキスト
研究実績の概要

風景画像中の文字認識を実現するために,画像中の特徴量抽出アルゴリズムの検討,抽出特徴量を利用した基礎的認識アルゴリズムの構築と認識特性の調査を行った.
本研究は,文字領域の推定処理を排除した認識アルゴリズムの構築を目的としているため,認識対象画像の全てから特徴量を抽出する.本年度では幾つかの特徴量を検討したが,画像を領域分割し,各領域の境界線を構成する閉曲線をShape Contextをベースとした二次元ヒストグラムを利用した形状の特徴量を主に利用し認識実験を行った.
画像中の文字の特性とした,ある文字の周辺には大きさの近い他の文字が存在し,形状のみではなく,閉曲線の相互の位置関係,相対的な大きさなども認識の高精度化のために重要な特徴量であると考えた.そこで本年度では,形状の特徴量以外に,相対的な大きさ,位置関係を評価可能な特徴量を導入し,それらを利用した基本的認識アルゴリズムを構築した.
認識アルゴリズムにおいては,特性の異なる特徴量を確率分布で近似することで,分布特性の違いを吸収し,一つの評価関数で評価可能なアルゴリズムを構築した.更に,画像から抽出された複数の領域を組み合わせて一つの文字として認識するための領域組み合わせの評価方法も認識アルゴリズムに組み込むことを実現した.現時点では,基礎的認識結果を得たのみではあるが,相対的な大きさ,位置を表現する特徴量を導入することにより,文字以外の領域を排除実現し,更に,形状の特徴量のみでは誤認識となる文字を補正することが可能であることを確認することが出来た.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究計画とは異なる特徴量を利用する方針となってはいるが,本研究課題の目的実現に必要な特徴量抽出方法とそれを利用した基礎的認識アルゴリズムを構築したという点におて,おおむね順調に進展していると判断していいる.

今後の研究の推進方策

現時点では,画素値(色)を利用した画像の領域分割を用いている.これにより抽出可能な領域と不可能な領域が存在している.特に,背景が映り込み,文字領域が明確に分離出来ない画像では,抽出されなかった領域の認識対象となならない問題点が残っている.
この対処法として,文字としてある程度の確度で認識された領域の特徴を,その周辺の文字の存在の事前確率として扱うことで,画素値の情報のみでは分離不可能な領域分割・抽出が出来るのではないかと考えている.この考え方を基本として,認識対象の事前知識を導入した高精度の認識のための領域評価方式を今後の主な研究課題として取り組んでいく予定である.

次年度使用額が生じた理由

当初,研究成果発表の速報性を考え国際会議での発表を予定し,旅費を計上していた.国際会議での論文発表は実現したが,業務都合により国際会議を欠席せざるを得なかったため,旅費の未使用額が大きくなってしまった.

次年度使用額の使用計画

今後の課題として残っている画像の領域分割の高度化の研究に伴う,人間による領域評価データを得るために,実験協力者への謝金の使用を想定している.また,今年度で出席出来なかった国際会議への出席など,積極的に研究成果の発表を行うための旅費として使用する予定である.

  • 研究成果

    (3件)

すべて 2015 2014

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 1件) 学会発表 (1件)

  • [雑誌論文] Scene Text Recognition based on Positional Relation between Closed Curves2014

    • 著者名/発表者名
      Yuji Waizumi, Kazuyuki Tanaka
    • 雑誌名

      2014 Second International Conference on Artificial Intelligence, Modelling and Simulation

      巻: 1 ページ: 182-186

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Bayesian Image Segementaions by Potts Prior and Loopy Belief Propagation2014

    • 著者名/発表者名
      Kazuyuki Tanaka, Shun Kataoka, Muneki Yasuda, Yuji Waizumi, and Chiou-TIng Hsu
    • 雑誌名

      Journal of The Physical Society of Japan

      巻: 83 ページ: 1-11

    • DOI

      10.7566/JPSJ.83.124002

    • 査読あり
  • [学会発表] CNNとSVMを組み合わせた歩行者検知の効率化に関する一検討2015

    • 著者名/発表者名
      斎藤拓馬,和泉勇治,田中和之
    • 学会等名
      電子情報通信学会 PRMU研究会
    • 発表場所
      慶應義塾大学理工学部矢上キャンパス
    • 年月日
      2015-03-19 – 2015-03-20

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi