2005 Fiscal Year Annual Research Report
大規模高信頼分散システム・アプリケーションの為の高精度故障検出器
Project/Area Number |
17700055
|
Research Institution | Tokyo Denki University |
Principal Investigator |
林原 尚浩 東京電機大学, 理工学部, 助手 (20397227)
|
Keywords | 高信頼性 / 分散システム / ネットワーク・コンピューティング |
Research Abstract |
本プロジェクトでは,大規模高信頼システムやアプリケーションのための高精度故障検出器を実現する.これにより,このようなシステムやアプリケーションを構築する際に,別途,システム・アプリケーション毎の故障検出機構(例えばハートビートメッセージの送受信等)を作成する必要がなく,ノードに常駐するプロセスとして動作する,故障検出器に問い合わせを行うことでその役割を代替することができる.また,従来のタイムアウトに基づいた故障検出器では実現できなかった,「故障している度合い(suspicion level)」に基づく故障検出を行うことで,よりユーザの要求を実現し,かつ精度の高い故障検出を実現する.このような高精度故障検出器の実現に向けて以下の活動を行った. -φfailure detector(故障検出モジュール)のプロトタイプの作成 -さまざまなネットワーク環境下(WAN, LAN)での実験,評価 スイス連邦工科大学-北陸先端科学技術大学院大学間のWANと北陸先端科学技術大学院大学,東京電機大学のそれぞれの学内LANで実験を行い,φfailure detectorの性能評価を行った. -故障情報伝播方式の提案(アーキテクチャ,プロトコル等) タイムアウトに基づいた故障検出器の出力(二値)とは異なり,絶えず変化するsuspicion level(正の実数値)を効率よく伝搬するには新たなプロトコルが必要である.このために,多数のアプリケーションプロセスに対して要求されたsuspicion levelに応じた情報を迅速に提供することができる故障伝搬プロトコルとその実現に必要なアーキテクチャの設計を行った. 上記の活動を行った結果,以下の学会で研究成果の発表を行った. -国際会議NBiS 2005 -情報処理学会第13回DPSワークショップ
|