• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

文字認識高精度化のためのマルチテンプレート化手法に関する研究

研究課題

研究課題/領域番号 13780301
研究種目

奨励研究(A)

研究機関東北文化学園大学

研究代表者

孫 方  東北文化学園大学, 科学技術学部, 助手 (90316448)

キーワードパターン認識 / 文字認識 / OCR / マルチテンプレート / 辞書 / クラスタリング / 距離尺度 / マハラノビス距離
研究概要

本研究では、文字認識の高精度化のために有効なマルチテンプレートの辞書を作成する手法の開発を目指し、辞書複数化のための新たなクラスタリング手法を開発することを目的とする。そして、開発された手法を用いて、学習サンプルを与えたときに誤認識率を最小とするようなマルチテンプレートの辞書を作成するアルゴリズムを定式化する。
辞書の複数化のためのクラスタリングアルゴリズムを開発した。従来クラスタリングとはパターンをその類似性によって分類する目的で行われるものであるが、本研究では同一カテゴリー内のパターンを細分化し、他のカテゴリーのパターンと区別できるようなカテゴリーの組にすることが目的であるから、これまで提案されている手法では不適当であると考えられる。本研究ではこの点を踏まえ、マルチテンプレート辞書作成に適した新たなクラスタリング手法を開発し、これまでに開発されてきた様々なアルゴリズムと比較、検討した。
特に以下の二点について考慮した。
・他のカテゴリーの分布をいかに考慮するか
あるカテゴリーのパターンをクラスタリングするために、他のカテゴリーの情報も合わせ持つ必要がある。これをいかに持ち、クラスタリング時にどう反映させるかを検討した。
・分割のしかた
本手法では、カテゴリー内のパターンが似ているかどうかで分割するのではなく、カテゴリー内のパターンの分布を忠実に表現できるように分割することが求められるため、文字パターンの分布を考慮した距離尺度としてマハラノビス距離を検討した。

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi