2017 Fiscal Year Annual Research Report
高精度なアクセスパターン予測に基づく省電力大容量ストレージシステムに関する研究
Project/Area Number |
17H01718
|
Research Institution | University of Tsukuba |
Principal Investigator |
加藤 和彦 筑波大学, システム情報系, 教授 (90224493)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 洋丈 筑波大学, システム情報系, 准教授 (00456716)
長谷部 浩二 筑波大学, システム情報系, 准教授 (80470045)
岡 瑞起 筑波大学, システム情報系, 准教授 (10512105)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | ストレージシステム / 省電力 / データセンタ / 機械学習 / アクセスパターン予測 |
Outline of Annual Research Achievements |
今年度は,主にシステムの基本設計と試作実装を中心に研究を行った。本研究課題で目指すシステムは,数百から数千台のディスクドライブによって構成される。加えて,データの格納場所やアクセス予測の情報などの属性情報を管理するためのインデックスサーバと,さまざまな情報から将来のアクセス予測を行うサーバを備えるものである。また,ディスクドライブは論理的に格子状に配置されており,新しいデータは次々と格子の左上から順に格納されていく。さらに,省電力化のために,アクセスパターン予測サーバの予測値をもとに,負荷が集約されるように定期的にデータの再配置が行われる。今年度は,こうしたシステムの基本設計がほぼ完了した。また,システムの基本動作の試作実装を,ScalaやGoなどの複数のプログラミング言語を用いて行い,アクセスパターンを入力するとディスクの稼働率などが取得できるシミュレータを作成した。このシミュレータは,アクターライブラリなどの技術を用いることにより,実際のシステムにも容易に実装ができるように工夫がなされている。また,実際のサービスのアクセスパターンの取得については,写真共有サイトの約50,000枚の写真のアクセスパターンを調査しており,実験で利用できるようなリアルデータが順調に得られている。 以上で得られた成果をもとに,今年度はリアルデータを用いた性能評価にも着手した。一方,将来のアクセスパターンの予測手法についても,機械学習のアルゴリズムを用いて開発が行われた。しかしながら,開発中のアクセスパターンの予測手法の性能を試作実装により評価する過程において,当初の予測に反して高頻度でアクセスされるデータをキャッシュディスクに格納すると,性能向上の可能性のあることが判明したため,評価をやり直す必要が生じた。こうした課題については,今後取り組む予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題は,大きく分けて,(1)システムの基本設計,(2)シミュレーションによる評価,(3)リアルデータの取得と機械学習によるアクセスパターン予測アルゴリズムの開発,(4)試作実装による評価の4つを目標としている。当初の計画としては,今年度はこのうちの(1)~(3)を中心に実施する予定であり,いずれも概ね想定通りの成果を得ることができたと言える。 システムの基本設計については,今年度の研究により概ね完了することができた。ただし,人気度の高いファイルの格納方法については,今後も検討する必要がある。シミュレーションによる評価についても,様々なプログラミング言語を用いて複数のバージョンのシミュレータの作成を試みており,その結果,大きな変更を加えなくても直ちに実機に実装可能なシミュレータを得ることができた。さらに,リアルデータの取得とアクセスパターン予測アルゴリズムの開発についても,当初の予想に反する結果が出たことから再検討する必要が生じたものの,データの取得など,大部分で計画通り遂行できたと言える。 以上のことから,これまでの研究の進捗状況は,おおむね順調に進展していると考えられる。
|
Strategy for Future Research Activity |
今後の研究の推進方策としては,まずシステムの基本設計については概ね完成しているが,今年度課題として残された人気度の高いデータの格納方法については,今後の本格的な評価実験の結果を見ながら,適宜改良を加える予定である。また,シミュレータの開発については,リアルデータの取得に限界のあることから,今後は,システムにアップロードされるファイルの属性情報がクライアントの集団の中で生成される過程を模したシミュレータの開発も目指したいと考えている。これにより,SNS上で生成されるファイルの人気度を,ユーザのフォロー関係などのパラメータによって変化させながら,さまざまな場合におけるシステムの省電力性能の評価が可能となる。さらに,アクセスパターンの取得についても,当初の計画通り継続して実施する予定である。 一方で,今年度の課題として残されたアクセスパターン予測のアルゴリズムの開発と評価については,当初の予想に反する結果を踏まえて再検討を行う予定である。 さらに,次年度以降は,実機による実装の比重を徐々に高め,最終的な性能評価へと結びつけたいと考えている。
|