研究概要 |
本研究では,文書画像中に存在する文字列を見つけ出し(文字列抽出),またその文字列が何と書かれているかを認識(文字列認識)することを目的としている. 今年度の研究実績を以下に述べる. (1)文字列抽出 本研究では,文字列領域は短い線分が密集している矩形領域と定義している.そのため,画像全体に対し,線分単位のハフ交換を行い,画像中の線分が密集している領域を抽出していた.今年度は,さらに画像をいくつかの部分画像に分割し,各部分画像ごとに処理を行うようにした.これにより,短い文字列も良好に抽出できるようになった.(口頭発表済み) (2)文字列認識 従来,文字列を認識する場合,文字列から個々の文字を取り出し,その個々の文字について文字認識を行い,それぞれの結果を統合して文字列の認識を行う方法がとられている. 本研究では,文字列全体を一つのパターンとみなし,文字列全体に対し直接マッチングを行う方法を行っている.本方法を手書き文字列の認識に適用した結果,文字同士が接触している場合や,一部の文字が大きく変形している場合でも良好な結果が得られた.この結果は,論文誌および口頭にて発表を行った.
|