研究課題/領域番号 |
23500236
|
研究機関 | 佐世保工業高等専門学校 |
研究代表者 |
志久 修 佐世保工業高等専門学校, 電子制御工学科, 准教授 (00235516)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 文字認識 / 歪み文字 |
研究概要 |
実験システム構築とアルゴリズム開発を行った。実験システムでは、膨大な文字画像を得るため、コンピュータ内で生成した画像を大型液晶ディスプレイに表示し、それをカメラで撮影し、認識処理の入力とした。コンピュータで様々な画像を生成することができるため、膨大な画像数を使った実験が可能となった。具体的には、(1)計算機内に、実際に平面上の文字を撮影した画像データ、文字フォントの組み合わせによる文字列データ(テキストデータ)を用意する。(2)計算機内に、文字に関する情報(文字サイズ、文字間隔、文字フォント等)を用意する。(3)計算機内で、文字列データ(1)に対し、変形パラメータ(2)による見え方画像を生成する。コンピュータグラフィクス技術を利用する。(4)計算機内で生成した画像を、大型液晶ディスプレイに表示する。(5)大型液晶ディスプレイの画面を、カメラで再撮影する。カメラは、様々な品質の画像を得られるように、高性能IEEE1394カメラ、民生用ディジタルカメラ、民生用ビデオカメラ、ウェブカメラなど複数の性能のカメラを用意する。(6)撮影した画像に対し、開発する文字認識処理を行う。この文字認識処理に、文字単体の正規化、曲面上の文字列認識を組み込む。 この実験システムの利点は以下のとおりである。・膨大な画像に対する認識実験、評価を自動的に行うことができる。・計算機内で生成された変形だけではなく、実際の撮影による現実的な変形(カメラの解像度、カメラ・プロジェクタ・スクリーンの角度、撮影時の照明等)も反映することができる。これらのシミュレーション実験での評価をフィードバックさせながら、アルゴリズムの開発を行っていく環境を構築できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
実験環境の構築が完了したため。本研究では、多くの文字画像に対して実験を行う必要があるため、実験環境の構築が重要である。今後はこの実験環境を使って、文字認識アルゴリズムの開発を行っていく。
|
今後の研究の推進方策 |
今後は文字認識アルゴリズムの開発に注力していく。具体的には、今年度構築した実験環境を使って、認識アルゴリズムの開発と評価を繰り返し行っていく。本研究で開発した文字認識アルゴリズムと、我々がこれまでに開発している技術(文字成分抽出、文字列抽出、文字補正)とを組み合わせて、実環境で撮影された画像に対しての性能を調べる。すなわち、文字成分抽出、文字列抽出、文字補正、文字認識の全てをまとめた性能を調査する。評価項目として、認識性能、処理時間等を調査していく。
|
次年度の研究費の使用計画 |
本年度に構築した実験システムを用いて、主にアルゴリズム開発や評価実験を行う。そのため、パソコン関係の消耗品、データを取るための研究補助、研究打ち合わせ等の出張などに研究費を使用し、新規に設備を購入することはない。「次年度使用額」が約20万円になっている。この理由は、システム開発は当初の予定より安価に完了し、研究補助員を雇用して多くのデータを取ったため、当初の予定より研究補助の費用が多くなっている。これらの差額として「次年度使用額20万円」が残った。具体的には、以下のとおりである。当初の予定ではプロジェクタを使ってスクリーンに投影した画像を各種カメラを使って再撮影する予定であった。またさまざまな視点からの画像を取るため、パソコン雲台を購入予定であった。しかし、スクリーンに投影させるより、大型液晶ディスプレイに表示させた画像のほうが品質が良く、本来の看板等の文字を再現していると判断し、さらに視点移動は自動制御ではなく、固定視点で十分であると判断した。そのためにプロジェクタとスクリーンではなく、大型液晶ディスプレイを購入し、さらに雲台の購入はしなかったため、予定より安価にシステムの構築が完了した。研究補助として、画像取り込みプログラムの開発補助、データ取り込み補助を依頼した。予定よりも研究補助を多くの時間依頼したために、研究補助の費用が予定よりも大きくなった。次年度は、「次年度使用額20万円」を研究補助およびパソコン関係の消耗品の費用に充て、効果的に研究を推進する予定である。
|