研究概要 |
本研究の目的は,モジュール化されたニューラルネットワークを用いた画像特性推定に基づく文字認識システムを構築し,自由視点認識を実現することである.その前半段階として平成9年度に以下の研究を実施した. 1.ニューラルネットワークによる画像特性推定の有効性と,認識対象となる文字の特徴検出を実現するための実験および研究を実施した.その概要は以下の通りである. (1)認識対象となる画像の画像特性をあらわすインデックスとして濃度ヒストグラムに注目し,その有効性を検証した. (2)単体のニューラルネットワークについて濃度特徴と画像の状況との対応を学習可能であるかどうか検討し,ヒストグラムを正規化する事によって容易に可能となることが明らかになった. (3)新しい輪郭特徴検出アルゴリズムについて検討し,適応2重しきい値処理を考案した. 2.以上の結果,文字画像の輪郭特徴を高速かつ安定的に検出するアルゴリズムを開発した. 3.また,ニューラルネットワークを用いることによって対象画像の画像特性に応じた特徴抽出が可能であることを確認した.これにより,ニューラルネットワークを利用して画像特性に基いた適応的な処理を実現可能であることがわかった. 以上の成果をふまえ,現在下記の手順で研究を進めている.特に,データの収集と分析ならびにモジュール化されたニューラルネットワーク群の構成方法についての検討と性能検証を平成10年度に実施する. 1.3次元半球座標上で縦横斜め計100視点以上から撮影し,認識対象となる文字画像データを収集している.合計5000枚以上の画像データを収集し,撮影方向・角度と文字輪郭やスケルトン特徴等の変動分析を行う. 2.モジュール化された複数ネットワーク群の統合エネルギー最小化を規範とする学習アルゴリズムについて考察中である.これにより,全体としてモジュールネットワーク群が正しく動作することを確認する方針である.
|