大規模高信頼分散システム・アプリケーションの為の高精度故障検出器
Project/Area Number |
17700055
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Computer system/Network
|
Research Institution | Tokyo Denki University |
Principal Investigator |
林原 尚浩 東京電機大学, 理工学部, 助手 (20397227)
|
Project Period (FY) |
2005 – 2006
|
Project Status |
Completed (Fiscal Year 2006)
|
Budget Amount *help |
¥2,800,000 (Direct Cost: ¥2,800,000)
Fiscal Year 2006: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2005: ¥1,700,000 (Direct Cost: ¥1,700,000)
|
Keywords | 高信頼性 / 分散システム / ネットワーク・コンピューティング |
Research Abstract |
本プロジェクトでは,大規模高信頼システムやアプリケーションのための高精度故障検出器を実現する.これにより,このようなシステムやアプリケーションを構築する際に,別途,システム・アプリケーション毎の故障検出機構(例えばハートビートメッセージの送受信等)を作成する必要がなく,ノードに常駐するプロセスとして動作する,故障検出器に問い合わせを行うことでその役割を代替することができる.また,従来のタイムアウトに基づいた故障検出器では実現できなかった,「故障している度合い(suspicion level)」に基づく故障検出を行うことで,よりユーザの要求を実現し,かつ精度の高い故障検出を実現する.このような高精度故障検出器の実現に向けて以下の活動を行った. インターネットの標準機構を用いた故障検出器の実現 ICMP(Internet control Message Protocol)を用いたφfailure detector(故障検出モジュール)を実装した. さまざまなネットワーク環境下(WAN, LAN)での故障検出器の実験,評価 北陸最先端科学技術大学院大学-東京電機大学間のWANと東京電機大学の学内LANで実験を行い,ICMPを用いたφfailure detectorの性能評価を行った. 故障情報伝播方式の提案(アーキテクチャ,プロトコル等) タイムアウトに基づいた故障検出器の出力(二値)とは異なり,絶えず変化するsuspicion level(正の実数値)を効率よく伝搬するには新たなプロトコルが必要である.本プロジェクトでは,故障検出器をPeer,故障検出器同士の監視関係をPeer間のリンクとして,Peer-to-Peerモデルに基づいた故障検出器群の再構成アルゴリズムと,その監視関係ネットワークを用いた故障情報伝搬プロトコルを開発した.また,このアルゴリズムをシミュレーションし評価を行った. 上記の活動を行った結果,以下の査続付き会議で研究成果の発表を行った. 国際会議AINA 2006 国際会議MNSA 2006 国際会議ICPP 2006 国際会議NBiS 2006 情報処理学会第14回DPSワークショップ 国際会議MNSA 2007
|
Report
(2 results)
Research Products
(1 results)