2008 Fiscal Year Annual Research Report
大規模システム管理のための自律分散型モニタリングシステム
Project/Area Number |
20700072
|
Research Institution | Kyoto Sangyo University |
Principal Investigator |
林原 尚浩 Kyoto Sangyo University, コンピュータ理工学部, 助教 (20397227)
|
Keywords | システム管理 / 故障検出 / 分散システム / ネットワーク / 耐故障システム |
Research Abstract |
本研究課題においては, すでに提案しているAccrual Failure Detectorモデルに基づいたモニタリンーグシステムの設計と主となる故障検出モジュールの実装を行った. 故障検出モジュールはICMPを用いて監視対象に問い合わせを行うことで故障検出を行うが, ネットワーク状況に適応した故障検出を行うことで, 故障の誤認を減らすことを目的としている. 実装はJava1.6で行っているが, 低レベル入出力に関するライブラリが提供されていないため, ICMPパケットの送受信には独自のライブラリを開発し, そのライブラリを用いて故障監視を行っている. さらに, 実行結果を確認するために, 簡易のGUIを開発した. また, このモニタリングシステムはAccrual Failure Detectorモデルにより, 故障監視部分と故障判定部分を分割して実装しているため, 多くのユーザが異なる指標で故障監視を要求しても, 従来のタイムアウトに基づいた故障検出器とは異なり, 効率的でユーザの要求に応じた故障検出が可能となった. 一方で, 大規模システムにおいて故障情報を伝搬するプロトコルの提案と評価を行った. このプロトコルは, 各サブネットを監視するモニタリングシステムが監視するシステム全体の故障情報を相互にやりとりするために用いられる. 提案したプロトコルは, 自律的にモニタリングシステム同士の論理的なネットワークを構成し, 故障情報の交換を行う. また, モニタリングシステムの故障によるネットワークの再構成も行うことができる.
|