文字認識高精度化のためのマルチテンプレート化手法に関する研究

研究課題

研究課題/領域番号	13780301
研究種目	若手研究(B)
配分区分	補助金
研究分野	知能情報学
研究機関	東北文化学園大学
研究代表者	孫方東北文化学園大学, 科学技術学部, 助手 (90316448)
研究期間 (年度)	2001 – 2002
研究課題ステータス	完了 (2002年度)
配分額 *注記	1,900千円 (直接経費: 1,900千円) 2002年度: 700千円 (直接経費: 700千円) 2001年度: 1,200千円 (直接経費: 1,200千円)
キーワード	パターン認識 / 文字認識 / クラスタリング / マルチテンプレート / カテゴリ / 辞書 / 混合正規分布 / 分布推定 / OCR / 距離尺度 / マハラノビス距離
研究概要	文字認識の高精度化のために有効なマルチテンプレートの辞書を作成する手法の開発を目指し、辞書複数化のための新たなクラスタリング手法について検討した。従来クラスタリングとはパターンをその類似性によって分類する目的で行われるものであるが、本研究では同カテゴリー内のパターンを細分化し、他のカテゴリーのパターンと区別できるようなカテゴリーの組にすることが目的であるから、これまで提案されている手法では不適当であると考えられる。検討の結果、パターンの分布を超楕円で近似した場合に誤認識が生じ得る状況を考慮し、誤認識が生じなくなるような分割を行う手法を考案した。さらに、分割されたパターンの分布を正確に推定し、より認識に適した辞書を構成する手法を検討した。特に、文字認識では学習に利用するサンプルを大量に収集するのが困難であるため、少数のサンプルを用いた場合に正確な推定を行える手法を検討した。その結果、混合正規分布の最尤推定法を基礎とし、近似を導入することにより、推定に要する時間を短縮すると同時に精度を向上させる手法を開発した。以上の手法を用いて、実際に収集した文字画像を認識する実験を行った。すべてのカテゴリーではなく必要なカテゴリーのパターンのみを分割することにより、従来法と比較して精度が向上すると同時に辞書のサイズを小さくすることが可能となった。さらに、本手法は文字認識以外にも適用することが可能であることから、顔画像の認識にも適用し、有効性を確認した。本研究の成果をまとめ、現在国際会議に投稿中である。

報告書

(2件)

2002 実績報告書
2001 実績報告書