研究概要 |
本研究では,次のことを行った. (1)申請者らが提案してきた「地図画像中の文字列の認識方法」の有効性を調べた. (2)新たな文字列切出し・認識方法を開発した. 1.地図画像中の文字の切り出し・認識方法の実験 認識方法は,まず,文字と同じ大きさの四辺形テンプレートにより文字らしい領域を切出し,次にそれらの領域すべてに文字認識を行い,文字と判定された領域を文字候補として取り出す・そして,文字列辞書(文字コード列)をもとにして,文字候補を文字列にグループ化していく.この方法の有効性を調べるため,1/25,000地形図をイメージスキャナにより2値画像として計算機に入力し,その画像中の文字列(地名など)の認識実験を行った.実験画像は(1,024×1,024画素)×10枚で,文字列数は合計173(703文字)である.文字単体辞書の登録カテゴリ数は約700カテゴリ,文字列辞書の登録地名数は約1,500件である.実験の結果,文字単体の認識率は84.2%と比較的悪かったものの,文字列認識率は95.9%と良好に認識できた.これより,文字列辞書(言語知識)を使うことにより,2次元的に散らばった不確実な文字候補集合の中から,正しい文字列を抽出でき,かつ文字以外の図形の正確な棄却が可能であることがわかった. 2.新たな文字列切出し・認識方法の開発 (1)文字列切出し 前述の方法では,文字の大きさが即知である必要があった.そこで,文字列を「線幅が文字サイズで,長さが文字列長となる線分」とみなして,この線分をハフ変換により抽出する方法を開発した.この方法では,文字の大きさが未知の場合でも対処できる. (2)文字列認識 前述の方法では,個別文字を認識して,その認識結果をグループ化して文字列を認識していた.この方法の改良版として,文字列全体を一つのパターンとみなしパターン整合法により一括して認識する方法を開発した.この方法を手書き文字列認識に適用して,良好な結果が得られた.
|