2012 Fiscal Year Research-status Report
スループット予測に基づいて複製配置を行う広域分散アーカイバルストレージ
Project/Area Number |
24700031
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | University of Tsukuba |
Principal Investigator |
阿部 洋丈 筑波大学, システム情報系, 准教授 (00456716)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 並列処理・分散処理 / 広域分散ストレージ |
Research Abstract |
当年度は,統計的機械学習に基づくスループット予測に関する成果のとりまとめ,および,スループットの予測精度向上が広域環境でのデータ配布時間に与える貢献のシミュレーション評価を主に行った. 我々が提案しているスループット予測手法は,Support Vector Regression (SVR) に基づいて,過去に得られた多数のサンプルから回帰曲線を得るという手法である.この手法は,過去に提案されている同種の手法が用いている累積分布関数(CDF)に基づく手法よりも測定ノイズに強く安定的な回帰曲線が得られるため,インターネット上の転送スループットのように外的要因の多い予測対象に適していると考えられる.我々は,本研究課題申請前に国際会議にて発表していた予備的な実験結果について,実験ケースの追加や,結果に対する統計的・確率的な分析を実施し,その結果を論文誌に発表した. また,スループットの予測精度向上が実際のアプリケーションが与える貢献の評価に関しては,実際の通信スループットの変動を広域環境上で計測した上で,その上で実際のアプリケーションを動かしたとしたらどの程度の処理時間の短縮が得られるかを計算機シミュレーションで評価するという手法をとった.想定するアプリケーションは,一箇所で大量のデータが生成され,それを北米やヨーロッパの複数拠点に転送して処理するというものである.それぞれの拠点の処理性能は同じと仮定しているが,通信性能については各拠点ごとに時々刻々と変化しているので,適切なスケジューリングを行うことが重要となる.我々は,提案手法である SVR に基づく方法,前述の CDF に基づく方法,ならびに,完璧なスループット予測が可能と仮定した場合の結果についてシミュレーションを行い,それぞれの結果の比較を通じて提案手法の分析を行った.分析の結果は国際会議に現在投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画では,当年度はスループット予測の高精度化,ならびに,現実のテストベッド環境を用いた評価を行うとしていた.いずれについても当初目標としていたレベルにまでは達することが出来ていると評価する.ただ,計画書には「PlanetLab 以外の環境,たとえば InTrigger や JGN-X のような他のテストベッド,および Amazon EC2 等の IaaS 型クラウドサービスを繋いで独自に構築する広域分散テストベッドなどを利用して」行うとしていたが,PlanetLab 上の評価だけで時間がかかってしまい,それ以外のテストベッド上での評価を実施することは出来なかった.しかしながら,PlanetLab は我々が想定する実利用環境に最も近い環境であるので,PlanetLab 上で得られた結果や知見だけでも十分に次年度以降の計画遂行に活かすことは可能であると考えている.
|
Strategy for Future Research Activity |
次年度は,当年度に実施しきれなかった PlanetLab 以外のテストベッド上での評価に加え,本研究課題のコアである複製配置スケジューリングアルゴリズムの構築と実現を目指す.当年度にシミュレーションを行ったスケジューリング問題では,各サイトは,通信スループット以外については全く同性能であるという前提のもとで行われていた.しかし,実際には様々な側面から見て異なった性能をそれぞれ持っているのが普通である.特に,本課題が対象としているような高信頼化システムの構築という観点からは,各サイトの信頼性の違いを考慮した上でスケジューリングを行うことが大変重要であり,信頼性の維持のためには通信のみを最適化するのでは適切ではないケースが十分考えられる.そのため,転送スループットの予測結果と,各サイトの信頼性を加味した上でデータ配置と転送スケジューリングを行うことが重要である.
|
Expenditure Plans for the Next FY Research Funding |
次年度は,当年度から繰り越した予算と次年度の配分予算を合算し,広域テストベッド PlanetLab の更新,もしくは別のテストベッドへの参加のために主に利用する計画である.その他には,国際会議に現在投稿中の内容を発表するための旅費や,豊橋技科大や大阪大学の研究協力者との打ち合わせのための旅費に利用する.
|