研究課題/領域番号 |
15K00066
|
研究機関 | 国立研究開発法人宇宙航空研究開発機構 |
研究代表者 |
藤田 直行 国立研究開発法人宇宙航空研究開発機構, 航空技術部門, 主幹研究開発員 (70358480)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 障害検出 / 原因特定 / 障害予測 / ビッグデータ |
研究実績の概要 |
一般に,コンピュータシステムには,障害の検出,通知,障害原因の特定等の機能を備えた管理ツールが組み込まれているが,障害の検出は,障害が起きた後に有効になるものであるため,事前に対応策を打つことは困難である.そこで,本研究では,ネットワーク,サーバ群などの重要かつ大規模なシステムを対象に,ハードウェア内部の物理的現象,システムから抽出できるログ情報,およびシステムを取り巻く物理的環境の状態を捉えた外部的な情報の3つを網羅的に収集し精査することによって,ハードウェア障害が起こる前の予兆を捉え,ハードウェア障害を事前に予測することを目的とする. 内部状態情報,内部物理情報,外部物理情報の3つの要素からデータを収集するため,初年度は必要な機器の整備を実施し,高周波用アンテナや高周波解析用のスペクトラムアナライザ等の内部物理情報測定機器を設置し,気温,湿度計等の外部物理情報収集に必要な機器を解析用PCに繋ぎ測定環境を整備した.また,整備した測定環境で実際の測定を試行した.整備した測定環境で得られたデータを,高周波,低周波および使用CPU数,メモリ等の大量のデータを収集・保持するプロファイリングツールを構築するための準備を開始した.具体的には,データ自動収集プログラムの作成,観測自動化のためのプログラムの作成等を実施することによって,大量のデータを自動的に収集,保持するシステムを構築するための設計とプロトタイピングを実施した.また,プロファイリングツールにはsyslog解析のための処理プログラムも組み込むことで,内部,外部物理情報 ,内部状態情報の3つの情報を一箇所にまとめて一括で管理し,解析することを可能とする設計とした.二年度目は、電磁波の微弱な変化を捉えるシステムを構築し障害が発生したハードウェアの実データの代わりに人工的に生成したデータを用いた場合の異常検知手法の比較を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コンピュータ内から発せられる電磁波の微弱な変化などの内部物理情報やシステムの設置環境から得られる外部物理情報を包括的に精査することによって障害の予兆を捉えるシステムの研究を実施している.障害が発生したハードウェアの実データの代わりに,人工的に生成したデータを用いた場合の異常検知手法について,ROC(Receiver Operating Characteristic)曲線を用いて比較をおこなった.異常検知は,予期しないふるまいをするデータパターンを見つけるための手法であり,さまざまな手法が提案されている.その中で,本研究では,4つの手法を検討した.生成した人工データを用いた場合,どの程度異常検知が可能であるかを,それぞれの手法を用いて検証した結果,次の結果が得られた.ROC曲線は陽性,陰性を分けるカットオフポイントの位置により性能が示される.ROC曲線グラフの縦軸を異常データの検出度合いとした場合,完全な分類が可能なときの面積は1となるが,本年度実験で使用した人工データにおいては,手法によってそれぞれ検出性能が異なっていることが示された.Manhattan SCALEとk-nearest neighbors algorithmにおいては急峻な推移が見られるが,Manhalanobis distanceとSupport vector machine(SVM)ではなだらかな曲線となった.本実験に限定するならば,SVMが良好な結果を示している.このことから,データに応じて手法を使い分けることで,全体として,より検出力の高いシステムの構築が期待できることが改めて確認された.
|
今後の研究の推進方策 |
異常データ検知のために,人工データを生成し,複数の異常検知手法について比較・検討を行った.クラス分けされた測定データの変数に関して,(1)扱う変数の種類、(2)変数間の関係と変数の絞り込み,(3)予測のための手法が課題となっている.(1)は、数値データまたはカテゴリデータとして扱うのかの検討,(2)は、相関係数・主成分分析・共分散構造分析等を用いて影響の小さい変数を取り除くことの検討,(3)は、ロジスティック回帰分析ないしは他の手法を用いて,二つのグループを分ける境界線を求める回帰式を導き,予測へ繋げることを引き続き検討する.また,プロファイリングツールを完成させると共に,異常データ判別ツールへの拡張を検討すると共に,これらの活動を障害予測モデル構築の足掛かりとする.さらに実験を行い,より検出精度の高い手法の検討を行う.
|
次年度使用額が生じた理由 |
予定していた研究打合せが、日程の調整がつかず延期となったため。
|
次年度使用額の使用計画 |
研究の打合せの旅費に使用する予定。
|