本年度は,研究目的の一つである「実時間高速カーネル行列学習アルゴリズムの構築」に向け,制約付きk-meansとアンサンブル学習を組み合わせたアルゴリズムの洗練化を行った.このアルゴリズムは,クラスタリング結果を行列に変換することでカーネル行列を生成することが可能である.従来の制約付きk-meansアルゴリズムは高速ではあったが,クラスタリング精度に難があった.そこで,本研究では,改良型制約付きk-meansアルゴリズムを開発し,これをブースティングの弱学習器として用いることで,クラスタリング精度を向上させることに成功した.また,このアルゴリズムではブースティングのラウンド数を調整することで,計算時間とクラスタリング精度のトレードオフを図ることが可能である.このアルゴリズムを用いることで,ストリームデータ環境における新規データのカーネル値および新規制約の獲得を効率的に行うことができる.具体的には,新規データのカーネル値については,カーネル行列学習の途中で生成されるクラスタ中心を保存しておき,新規データを最近傍のクラスタ中心に所属させることで再学習することなくカーネル値の計算を行うことができる.また,研究目的の一つである「制約付与データ対の能動的選択アルゴリズムの構築」と関連する新規制約の獲得については,各データ対のブースティング中における同一クラスタへの所属確率を元に計算可能な制約同定に関するあいまい性の高いものを選択することで効率的な制約獲得が可能となる.一方,最後の研究目的である「実環境ストリームデータ分類システムへの応用展開」については,外れ値検出に基づくネットワークトラフィックデータからの異常発見システムを構築できたものの,上記アルゴリズムを用いた十分な実証実験を行うに至っておらず,今後の課題となった.
|