1999 Fiscal Year Annual Research Report
アクティブな中心窩視覚システムによる文書情報の獲得
Project/Area Number |
11750211
|
Research Institution | University of the Ryukyus |
Principal Investigator |
大城 尚紀 琉球大学, 工学部, 助手 (10295298)
|
Keywords | 中心窩視覚 / アクティブビジョン / 不変特徴 / 単眼視 / 文書情報 / OCR |
Research Abstract |
中心窩視覚を利用した単眼視によるアクティブステレオビジョンシステムに関するシミュレータを作成した.本シミュレータは文書情報として事前に用意した画像を与え,その画像に対して情報獲得処理を行なうものである.本研究では視点移動によって文書情報の存在する箇所についてのみの情報獲得を行なうものとしている.中心窩視覚の実装は複素対数極座標変換によっている.文書形式は横書きで左から右への流れを有するものと設定した.また,文字として想定するものは単純な形状として黒丸を設定し,垂直方向と水平方向に軸の比を変化させた楕円形状のものも含んでいる.今年度は文字の認識には重点を置かず,視点移動を行なう際に使用する情報として中心窩視覚の特徴である不変性によってこれを得るものとした.視点移動による情報獲得の特長である文書情報が存在している箇所のみの処理を実現するために,まず文書の全体像を大局視によって大まかに獲得し処理対象とする範囲を決定した.次に,その範囲対象の左上端へ視線を移動し,局所視によって詳細な情報獲得を行なう.さらに,行単位の視点移動では中心窩視覚の実装に適応した複素対数極座標変換の変換不変性によった.これは直交座標における回転方向と半径方向の成分とに分解されることを利用して,現在の処理で注視している文字の位置を検出しさらに隣接する文字との字間を検出して視点移動と注視を行なうものである.行の右端では空白となることからこれを検出させ,次行への視点移動を行なうものとした.以上の処理に関してシミュレータ上での動作を確認した.今後は,さらに文字形状が複雑な場合への対応と実機への実装を念頭においた処理の検討が必要である.また,市販の文字認識アプリケーションソフトを購入しこれを用いて,文字認識に必要な解像度などに対する検討も行なっている.この結果を中心窩視覚へ反映させる予定である.
|