• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

アクティブな中心窩視覚システムによる文書情報の獲得

研究課題

研究課題/領域番号 11750211
研究種目

奨励研究(A)

配分区分補助金
研究分野 知能機械学・機械システム
研究機関琉球大学

研究代表者

大城 尚紀  琉球大学, 工学部, 助手 (10295298)

研究期間 (年度) 1999 – 2000
研究課題ステータス 完了 (2000年度)
配分額 *注記
1,800千円 (直接経費: 1,800千円)
2000年度: 1,000千円 (直接経費: 1,000千円)
1999年度: 800千円 (直接経費: 800千円)
キーワード中心窩視覚 / アクティブビジョン / 単眼視 / 不変特徴 / 文書情報 / 文字認識 / OCR
研究概要

紙などに印刷された文書情報を機械可読とするには,いくつか段階を経るが大きく分けて文書情報を画像データとして得る段階とそれを認識する段階とがあり,両者の連携がなく,人手のパラメータ調整が行なわれており,さらに紙面の読み取り装置への設置も煩雑である.本研究ではこれらの文字認識処理を統合する.工学的に用いる画像は一般に画像全体で均一解像度であるが,本研究では中心窩視覚と呼ばれる視線の中心部において高解像度となり,周辺になるにつれてその解像度が低下するような不均一な構造を持つ視覚を,文書情報の獲得処理へ適用し効率的なシステムの構築を行なうことを目指した.中心窩視覚の実現にはLog Polar Mapping(LPM)を採用し,文字認識処理の実現とカメラの回転により画像情報をアクティブに獲得できる装置を製作した.文字認識では,日本語約1万4千字を対象にテンプレートマッチング実験を行なった.画像の多重解像度性を考慮して文字毎に数種の解像度画像を生成し,それぞれのマッチングを行なった.これによりある程度,段階的な文字種のカテゴリ分類と,中心窩画像の特徴である中心重視のマッチングが行なわれることが確認された.市販の文字認識ソフトにおいて高認識率となる文字の解像度値も検証により得ており,これらも参考にしたマッチング実験とした.実機製作では単眼視でパンとティルト方向に回転できるシステムとした.高解像度でのビデオ画像が得られるカメラを選定し,パーソナルコンピュータ上へ取り込み処理した.カメラの回転角に対しどの程度の歪みが画像に生じるのかを実際と計算値とで比較し,得られたカメラ画像から紙面を再構成する処理を実現した.なお,初年度の視点移動シミュレーションでは対象を黒丸としており,文字の場合(線画)との違いが明らかになったため実装しなかった.実機システムへの視点移動と文字認識処理の組み込みは今後の課題である.

報告書

(2件)
  • 2000 実績報告書
  • 1999 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi