研究概要 |
本研究は,現状のOCRと文字認識技術を用いて,人間との対話形式で協調し合いながら認識処理と修正作業を行うことで,現状の文書レベルでのOCRの適用範囲を,情景レベルの様々な画像中の文字情報にまで拡張させるが目的である.この目的を実現する一環として,「文書レベルにおける文字情報の電子化を支援する手法の提案と有効性の検証」,ならびに,「OCRで良好な認識結果が得られない情景レベルで存在する様々な文字情報に対して,OCRと人間が対話形式で協調し合いながら文字情報を電子化するシステムの開発」を実施した. 平成20年度では,まず本研究経費で購入したディジタルカメラを用いて,文字情報を含んだ様々な情景を撮影し,実験用情景画像データベースを作成した.そして,この実験用の情景画像に含まれる文字情報を認識するために必要な文字情報の検出・抽出手法である文字スポッティング手法を開発し,その有効性を明らかにした.また,抽出した文字候補に対するOCRを用いた時の認識精度についての調査を行い,OCRを導入する上での問題点や課題を明らかにした.結果として,情景画像中の文字情報を完全にスポッティングできるまでには至らなかったが,情景中に文字情報が存在する位置の特定の高精度化は実現できた. これにより,情景中の文字情報の電子化する際に,OCRに入力するためのパターンの切り出し,及び,文字情報でないパターンの非入力のプロセスの実現の可能性を高めることができた.次に,文書レベルでの文字情報の電子化支援システムとして,答案採点作業の負荷に伴う教職員の未採点や採点誤りを自動的にチェックし,人間に採点結果の再確認を促す『答案採点支援システム』の実現を目指した.このシステム開発で必要な重ね書き採点記号の分離,抽出,認識についてのルーチンについては,ほぼ実用レベルの結果が得られた.
|