研究概要 |
小型PC群をネットワーク接続したPCクラスタを構築し,大量の画像データを並列処理することによって有用な画像情報を抽出・データマイニングを行う手法を検討した. すでに,テンプレートマッチングにおける一般的なSSDA法を拡張することにより大量のデータから対象のオブジェクトを高速検出する手法を開発した.すなわち,高精細度でスキャンされた画像を対象とするため,従来のSSDA法より高速化を実現するため,照合および誤差加算の打切り処理と間引き処理をハイブリッドさせた高速マッチング法を考案した.これにより,双方の高速化効果を持つテンプレート処理が実現でき,高精細画像処理を高速実行できる. 一方,最小距離法での進化的最適特徴選択を行った.初期の特徴量組み合わせをランダムに選ぶ操作を100000回繰り返して得られた上位3つの最適解A1,A2,A3と,疑似総当たり法で得られた準最適解S1(ランダムな100000通りの組み合わせの中での最適解)を比較し,評価基準CCE値および最小距離分類法による分類結果の正解率を検討した.その結果,CCE値が小さいほど分類正解率が向上し,世代交代の有無では大幅な開きが生じた.このことはCCEの評価基準の適切さと最適解探索が正しく機能していることを示している. また,選択された最適特徴の組合せにおいて最も高い正解率を与える最小数の特徴量個数は15個〜13個となっており,原データ数の50%〜43%まで削減できた.従って,本研究で用いた手法は,データマイニング問題におけるデータ次元数の縮約と性能の向上を同時に満たすことが可能といえる.データ次元数の縮約による効果は,特徴空間の冗長性や曖昧さの減少とクラスタ構造の明確化をもたらすとみられるため,本手法を用いることによって膨大なデータの効率的処理の実現が期待される. しかし,膨大な特徴組合わせとノード間通信輻輳に起因すると思われる性能低下が発生し,著しく長時間の計算時間を要した.そのため,多数の仮説検証を行うには不十分であった。従って,今後の課題として,並列化の効率を最大限発揮するためのさらなる工夫が必要である.
|