• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Accuracy improvement of the 3D rotation angle estimation of characters by the probabilistic interpolation

Research Project

Project/Area Number 16K00236
Research InstitutionMie University

Principal Investigator

若林 哲史  三重大学, 工学研究科, 教授 (30240443)

Co-Investigator(Kenkyū-buntansha) 大山 航  九州大学, システム情報科学研究院, 准教授 (10324550)
Project Period (FY) 2016-04-01 – 2019-03-31
Keywords3次元回転文字認識 / カメラベース文字認識 / 車番認識 / 3次元回転角度推定 / 日本語文字認識
Outline of Annual Research Achievements

我々は、カメラベースの文字認識において、回転や透視投影により変形した文字の認識を可能とする3次元回転文字認識手法を提案している。このとき、個々の文字の3次元回転角度を推定して文字印刷面の法線ベクトルを求め、その向きでグルーピングすることで文字列を検出できるが、3次元の回転角度推定に必要な記憶容量が膨大となるため、字種の多い、漢字・かなを含む日本語を対象とすることが難しかった。
平成28年度は、特徴ベクトルの低次元化と回転角度候補の確率的補間により、記憶容量を増加させることなく文字印字面回転角度の推定精度を高めるとともに、文字候補の組み合わせと車番テンプレートのマッチングを取ることで、様々な角度から撮影された車番の認識を実現した。
平成29年度は、3次元回転により変形した文字から推定される2通りの回転角度のうち、正しい方を選択する手法を開発して回転角度推定をさらに高精度化するとともに、複数の連結成分からなるかな文字で構成される文字列の撮影画像から、組み合わせ最適化により、文字切り出し・認識・回転角度推定を行う手法について外部発表を行った。また、関連研究として、画像中の製造メーカーのロゴ切り出しと認識手法を開発し、電子情報通信学会論文誌にて発表した。
平成30年度は、複数の連結成分からなる文字の切り出しと認識を、かなから漢字にまで拡張するために、組み合わせ最適化のアルゴリズムを改良し、関連研究として、複雑な背景中のドット文字の抽出・認識、連結成分解析による文字列の言語推定手法について研究を行い、それぞれ外部発表を行った。
これらの研究成果によって、字種の多いかな・漢字に対する3次元回転文字認識が可能となった。

  • Research Products

    (5 results)

All 2018 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (3 results) Remarks (1 results)

  • [Journal Article] Extraction and Recognition of Shoe Logos with a Wide Variety of Appearance using Two-Stage Classifiers2018

    • Author(s)
      Kazunori Aoki, Wataru Ohyama, Tetsushi Wakabayashi
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: Vol.E101-D, No.5 Pages: pp.1325-1332

    • DOI

      https://doi.org/10.1587/transinf.2017MVP0026

    • Peer Reviewed
  • [Presentation] 撮影条件に依存しないドットマトリクス文字抽出2018

    • Author(s)
      伊藤 冬湖,大山 航,若林 哲史 ,白井 伸宙
    • Organizer
      第24回・画像センシングシンポジウム(SSII2018)
  • [Presentation] カメラベースOCRにおける連結成分解析を用いた東アジア言語の判定2018

    • Author(s)
      冨岡 永伍,大山 航,若林 哲史, 白井 伸宙
    • Organizer
      第24回・画像センシングシンポジウム(SSII2018)
  • [Presentation] 複数の連結成分で構成される3次元回転文字の認識2018

    • Author(s)
      溝手 健志,大山 航,若林 哲史
    • Organizer
      第21回画像の認識・理解シンポジウム(MIRU2018)
  • [Remarks] ヒューマンインタフェース研究室 業績一覧

    • URL

      http://www.hi.info.mie-u.ac.jp/publications/

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi