2014 Fiscal Year Research-status Report
Project/Area Number |
26330251
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
岡部 正幸 豊橋技術科学大学, 情報メディア基盤センター, 助教 (50362330)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | カーネル行列学習 / アンサンブル学習 / 異常検知 |
Outline of Annual Research Achievements |
本年度は、研究目的である「大規模かつ流動的な性質をもつストリームデータの分類に適用可能な実時間カーネル行列学習アルゴリズムの構築」に向けて、1) アンサンブル学習に基づくカーネル行列学習における高速な再学習アルゴリズム、および、2) ネットワークトラフィックデータを対象とした対話的な異常検知システムの構築を行った。 まず、1) については、アンサンブル学習に基づくカーネル行列学習を行う際に、データ対の制約が逐次的に与えられた場合に、再学習を高速に行うためのアルゴリズムを構築した。このアルゴリズムは、弱学習器である制約付きk-meansの実行後に得られるクラスタ中心と、アンサンブル学習であるブースティング実行後に得られる各弱学習器の重みを記憶しておき、これらを再利用することで再学習を高速に行うことができる。これにより、ストリームデータのように次々とデータが発生する環境におけるカーネル行列に基づくデータ分類システムの適用が見込める。 次に、2) については、実環境ストリームデータ分類の応用例として、ファイアウォールログからの異常検知システムを試作した。このシステムは、異常通信を行っているホストを特定するための特徴量をユーザが自由に組み合わせることができ、選択した特徴量に基づく異常スコアのランキング変動を可視化したグラフを見ながら、インタラクティブな分析を行うことができる。試験運用の結果、NAS付属のP2P機能が意図せず使用されていることなどを発見することができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は、3つの主な研究目的のうちの2つ、1) 実時間カーネル行列学習アルゴリズムの構築、2) 実環境ストリームデータ分類システムへの応用展開について、それぞれ研究を進めた。 1) については、アンサンブル学習に基づくカーネル行列学習における再学習の高速化を実現できている。また、2) については、実環境ストリームデータ分類タスクとして掲げた、ネットワークトラフィックデータからの異常検知システムについて、データ収集と分析環境の整備が完了し、検知システムの試作および試験運用を行っている。 以上のように、これら2つの研究目的についてそれぞれ60%程度達成できており、研究全体としておおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
今後は、アンサンブル学習に基づいた学習方法をベースに、カーネル行列学習の更なる高速化方法について研究を進めるとともに、再学習を前提とした訓練データの能動的選択方法について具体的なアルゴリズムの構築を行う。また、カーネル行列学習を利用した異常検知システムの改良を進めていく予定である。
|
Causes of Carryover |
H26年度はワークステーションの購入を予定していたが、CPUロードマップの都合から次年度に購入した方がコストパフォーマンスに優れると判断したため。
|
Expenditure Plan for Carryover Budget |
H27年度は、計算用ワークステーションと、ネットワークトラフィックデータからの異常検知システムの評価を行うための環境整備として、ノートパソコンを数台購入する予定である。また、前年度および当該年度の成果発表を行うため、国内外の研究会議への参加経費(参加費・旅費)、論文発表のための経費(論文掲載費)に充当する予定である。
|