2010 Fiscal Year Annual Research Report
大規模システム管理のための自律分散型モニタリングシステム
Project/Area Number |
20700072
|
Research Institution | Kyoto Sangyo University |
Principal Investigator |
林原 尚浩 京都産業大学, コンピュータ理工学部, 助教 (20397227)
|
Keywords | システム管理 / 故障検出 / 分散システム / ネットワーク / 耐故障システム |
Research Abstract |
本研究課題では,大規模なシステムにおけるモニタリングシステムの構築に向けて,a)故障検出器の開発,b)故障情報伝搬機構の開発,を行ってきた.項目b)については,前年度に実施し,今年度は項目a)についての実装と評価を行った. 今回実装を行った故障検出器ACCMOSはJava 1.6で実装しており,ICMPによってネットワークリソースの監視を行う.ACCMOSはAccrual Failure Detectorに基づいたネットワーク適応型故障検出器であり,有線/無線LANおよびWANなどの環境で高い故障検出精度を示した.このことから,ACCMOSは高いネットワーク環境適応性を有することが確認できた. 我々が先行研究で提案したAccrual Failure Detectorとその実装は,現在,Facebookなどを始めとする大規模なプラットフォームにおいて使用されているキーバリューストア(KVS)型分散データベースCassandraにも実装されており,5億人を越えるユーザに対するサービスを支えている.このことからも,Accrual Failure Detectorの実装であるACCMOSが大規模システムに対して適応する能力(スケーラビリティ)があることが実証されている. 故障検出器ACCMOSは,汎用故障検出モジュールとして実装しており,システムのモニタリングだけでなく,各家庭のホームネットワークにおける情報家電のモニタリングやパワーグリッド(電力網)の制御などにも応用することが可能である.
|