研究概要 |
本年度の目的は,申請者が提案している文字切り出し手法(FPV法,Feature Point Voting Method)と高速な検索原理(LLAH法,Locally Likely Arrangement Hashing)を融合することで,高速な文字認識手法を提案することである。 LLAH法の原理を文字認識に適用することを試みた。LLAH法は原著論文において,単語の重心を特徴点としたときの特徴点の配置に基づき,デジタルカメラで撮影された文書画像がデータベース中のどの文書画像と一致するかを高速に検索する用途に使用されていた。そのために,多数の安定した特徴点を必要とする。したがって,その方式をそのまま文字認識に適用しようとすると,どのように特徴点を抽出すればよいのかという検討課題が浮かび上がった。さらに,文書画像では平均数百個の特徴点が存在したのに対して,文字からそれと同程度の特徴点を抽出することは困難であるという問題点もあった。そこで,検討の第一段階として,文字の輪郭から特徴点を抽出することにした。しかし,輪郭から得られる特徴点は多くないため不足するため,従来のLLAH法程の情報量は得られない。そこで,従来法のように情報を単純に多数の特徴点から得ることを諦め,2種類の角や直線といつた特徴点の種類を記述することで情報を得ることにした。実験の結果,相似変換に対してはロバストな認識を行えることが確認できた。 しかし,この方法は連結成分単位の認識であるため,複数の連結成分から成る文字に対する認識や,連結成分が欠損した場合の認識方法を今後検討する必要がある。
|