2013 Fiscal Year Annual Research Report
Project/Area Number |
23700167
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
岡部 正幸 豊橋技術科学大学, 情報メディア基盤センター, 助教 (50362330)
|
Keywords | 距離学習 / 制約付きクラスタリング / 外れ値検出 |
Research Abstract |
最終年度は,本課題の研究目的2. 「逐次更新可能な距離学習アルゴリズムの構築」および3.「実用システムへの応用展開」に関する研究を主として行った. 研究目的2については,前年度に構築したBoostingとクラスタアンサンブルに基づく距離学習アルゴリズムに関する性能について,実験的検証を進め論文としてまとめるとともに,このアルゴリズムに基づく能動的制約選択アルゴリズムの構築も行った.本アルゴリズムは,先述の距離学習アルゴリズムにおけるBoostingの途中結果を利用している.Boosting過程においては,制約付きk-meansアルゴリズムによってクラスタが複数生成されるが,その過程において各データペアが同一または別クラスタに属する確率に違いが生じる.提案した能動的制約選択アルゴリズムでは,これをmustリンクまたはcannotリンクのどちらであるかを推定するのが難しいものに正解ラベルを与えるのがよいとするUncertainty Sampling仮説における曖昧性基準の計算に利用し,実験によりその有効性を示すことができた. 研究目的3については,外れ値検出に基づくネットワークトラフィックデータからの異常発見を行うためのシステムを構築し,実データを用いた検証を行った.本システムでは,異常通信を行っている学内ホストの発見を目的とし,ネットワークトラフィックデータとしてファイアウォールログを用いることとした.収集されたファイアウォールログはプロトコル別に分別され,IPアドレス毎に16次元の特徴ベクトルを生成する.この特徴ベクトルを元に外れ値アルゴリズムを実行し,異常検出を行う.また,本システムではWebベースのユーザインタフェースを構築し,人が対話的にログ分析を行える環境を構築した.試験運用では,本システムを用いてP2P通信などを発見可能であることが確認できた.
|