文字認識高精度化のためのマルチテンプレート化手法に関する研究

Research Project

Project/Area Number	13780301
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Tohoku Bunka Gakuen University
Principal Investigator	孫方東北文化学園大学, 科学技術学部, 助手 (90316448)
Project Period (FY)	2001 – 2002
Project Status	Completed (Fiscal Year 2002)
Budget Amount *help	¥1,900,000 (Direct Cost: ¥1,900,000) Fiscal Year 2002: ¥700,000 (Direct Cost: ¥700,000) Fiscal Year 2001: ¥1,200,000 (Direct Cost: ¥1,200,000)
Keywords	パターン認識 / 文字認識 / クラスタリング / マルチテンプレート / カテゴリ / 辞書 / 混合正規分布 / 分布推定 / OCR / 距離尺度 / マハラノビス距離
Research Abstract	文字認識の高精度化のために有効なマルチテンプレートの辞書を作成する手法の開発を目指し、辞書複数化のための新たなクラスタリング手法について検討した。従来クラスタリングとはパターンをその類似性によって分類する目的で行われるものであるが、本研究では同カテゴリー内のパターンを細分化し、他のカテゴリーのパターンと区別できるようなカテゴリーの組にすることが目的であるから、これまで提案されている手法では不適当であると考えられる。検討の結果、パターンの分布を超楕円で近似した場合に誤認識が生じ得る状況を考慮し、誤認識が生じなくなるような分割を行う手法を考案した。さらに、分割されたパターンの分布を正確に推定し、より認識に適した辞書を構成する手法を検討した。特に、文字認識では学習に利用するサンプルを大量に収集するのが困難であるため、少数のサンプルを用いた場合に正確な推定を行える手法を検討した。その結果、混合正規分布の最尤推定法を基礎とし、近似を導入することにより、推定に要する時間を短縮すると同時に精度を向上させる手法を開発した。以上の手法を用いて、実際に収集した文字画像を認識する実験を行った。すべてのカテゴリーではなく必要なカテゴリーのパターンのみを分割することにより、従来法と比較して精度が向上すると同時に辞書のサイズを小さくすることが可能となった。さらに、本手法は文字認識以外にも適用することが可能であることから、顔画像の認識にも適用し、有効性を確認した。本研究の成果をまとめ、現在国際会議に投稿中である。

Report

(2 results)

2002 Annual Research Report
2001 Annual Research Report