• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

認識アルゴリズムの統合と自律的学習認識システム

Research Project

Project/Area Number 15500097
Research InstitutionTohoku University

Principal Investigator

阿曽 弘具  東北大学, 大学院・工学研究科, 教授 (10005522)

Co-Investigator(Kenkyū-buntansha) 大町 真一郎  東北大学, 大学院・工学研究科, 助教授 (30250856)
後藤 英昭  東北大学, 情報シナジーセンター, 助教授 (40271879)
岩村 雅一  大阪府立大学, 大学院・工学研究科, 助手 (80361129)
Keywords文字認識 / 文書認識システム / 学習認識システム / 認識手法統合手法 / 信頼性評価 / 図表認識 / 統計的パターン認識
Research Abstract

本研究は、複数の認識アルゴリズムの能力を互いに補完させた統合システムで自律的に学習する機能をもたせた文書認識システムの構築を目指している。
本年度は、文字特徴量空間の内部構造の分析方法を実現するプログラムを作成し、日本語字種3134種の特徴量データベースを用いて具体的分析を行った。さらに、文字特徴量空間における文字カテゴリの同定のために、学習用データから決まる同一カテゴリ文字集団の記述法として、凸包領域、超球領域、超楕円体領域、超平行体領域による記述法を導入し、内部構造を様々な角度から分析する基盤を与えた。これらの記述にはそれぞれ固有の可変パラメータがあり、認識結果の信頼性に影響を与える。この可変パラメータの学習方法を与えた。また、複数の認識アルゴリズムを統合する一つの手法であるアンサンブル学習を用いる方法について、基礎的検討を行った。
文書認識手法は、ウェブ上にある様々な画像文書(pdfなどを含む)を文字コードベースの文書に変換するために適用できる。ウェブ上の画像文書に対して、文書構造解析システムを基本にしてウェブ上にある複数の認識エンジンを活用して認識するためのプラットホームを構築した。
本学習認識システムのための文書レイアウト解析に関して、スクリーントーンの除去手法を改良した。また、掛け時計の数字のように孤立した文字の抽出手法について改良した。デジタル写真による画像だけでなく、ビデオ映像の中の文字列を抽出する手法を開発した。
本年度は研究計画の最終年度であるが、当初の目的の基礎的部分の構築まで実現した。今後さらに検討し、自律的に学習する文書認識システムの構築を目指す。

  • Research Products

    (6 results)

All 2006 2005

All Journal Article (6 results)

  • [Journal Article] Self-Learning Architecture for Web Image Documents2006

    • Author(s)
      Hirotomo Aso
    • Journal Title

      Proc.of The 3rd Int.Symposium on System Construction of Global Network Oriented Information Electronics IGNOIE-COE05

      Pages: 145-148

  • [Journal Article] A Platform for Web-Based OCR Systems with Server Search Function2006

    • Author(s)
      Hideaki Goto
    • Journal Title

      Extended Abstracts of Seventh IAPR Workshop on Document Analysis Systems DAS2006

      Pages: 13-16

  • [Journal Article] Isolated Character Recognition by Searching Feature Points2005

    • Author(s)
      Masakazu Iwamura, Kazuya Negishi, Shinichiro Omachi, Hirotomo Aso
    • Journal Title

      Proc.8th Int.Conf.on Document Analysis and Recognition ICDAR2005

      Pages: 1035-1039

  • [Journal Article] Isolated Character Recognition by Searching Features in Scene Images2005

    • Author(s)
      Kazuya Negishi, Masakazu Iwamura, Shinichiro Omachi, Hirotomo Aso
    • Journal Title

      First International Workshop on Camera-based Document Analysis and Recognition CBDAR2005

      Pages: 140-147

  • [Journal Article] アンサンブル学習を用いた認識の高精度化に関する研究2005

    • Author(s)
      堀内 真, 大町 真一郎, 阿曽 弘具
    • Journal Title

      平成17年度電気関係学会東北支部連合大会講演論文集

      Pages: 296

  • [Journal Article] ビデオ映像からの文字列抽出手法2005

    • Author(s)
      野田口 玄, 大町 真一郎, 阿曽 弘具
    • Journal Title

      平成17年度電気関係学会東北支部連合大会講演論文集

      Pages: 301

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi