データマイニングは膨大なデータの中から有用な知識を抽出することを目的としている。通常の統計処理では、データの非線形性、非独立性、非数値あるいは欠損データの存在、および一括処理などのために困難であることが多い。このようなデータマイニングは従来の機械学習と極めて近い関係にあるが、ここで発掘しようとする知識は、対象の特性、クラスタリング・分類、予測に関わるものである。本研究においては、主にクラスタリング・分類を取り上げ、遺伝子を統合的に取り扱う共生進化アルゴリズムによる新しい方法を開発した。具体的には、共生進化アルゴリズムにおけるポピュレーションを構成する遺伝子の数、遺伝的アルゴリズムに基づくことから進化に直接関係する交差、突然変異の割合、適切な遺伝子を選択するための評価関数である適用関数の設定などの基本的事項について実験的に検討するとともに、本手法が遺伝的アルゴリズムより優れている理由を考究した。また分類・検索のための決定木を構築する際の問題点を調べ、並列的な構成に適しているとされる共生進化アルゴリズムを直列的ともいえる決定木の構成に適用するための方法を開発し、既存のC4.5と同程度以上の成果を得ている。さらに、共生進化アルゴリズムは統合的に遺伝子を処理することから、線形分離可能でないパターンクラスの識別に対し、線形識別関数を組み合わせた多数決機械の実現を図り、そのシステムを構築して実験を行った。すなわち、従来困難とされていた荷重学習に共生進化アルゴリズムを適用し、種々の非線形パターンクラスについて実験を行い、その結果本システムは十分に学習が可能であり、極めて有用であることを確かめている。
|