研究概要 |
本研究では,低品質文字を高精度に認識することを目的としている.本年度中に得られた研究成果を以下に述べる. 1. 劣化の程度を表す指標の定義 劣化の程度を定量的に表すために,劣化した文字画像を含む様々な文字画像を収集した.具体的には,複写機により複写した文書やファクシミリにより転送した文書をスキャナで読み取り,ワークステーションに取り込んだ.これらの劣化文字を対象に,文字パターンをいくつかの小領域に分割し,小領域ごとに劣化の程度を表す指標「つぶれ度」を定義した. 2. 劣化による分布形状の変化の解析 多くのサンプルパターンを用い,つぶれ度によって文字認識における特徴量の分布分布形状がどう変化するかを統計的に解析した.分布形状をパターン集合から得られる重心,主成分ベクトル(固有ベクトル),主成分軸上での分散(固有値)により定義し,分布形状がどのように変化するかを調べた.その結果,多くの場合劣化が生じたパターンでも重心はほとんど変化せず,主成分ベクトルと主成分軸上での分散が変化することが確認された. 3. 認識手法の検討 2.での調査結果をもとに,劣化文字を高精度に認識する手法を検討した.文字パターンの各部分の劣化の程度により分布形状を表す主成分軸や分散がどのように変化するのかを調査し,それをもとに分布形状を補正する手法を検討した.そして,パターン認識における代表的な認識手法である部分空間法に対して分布形状の変化を反映させる手法を考案し,認識実験を行なってその有効性を確認した.
|