2014 Fiscal Year Research-status Report
大規模分散処理環境を革新する「フロントエンドコンピューティング」パラダイムの創出
Project/Area Number |
26540040
|
Research Institution | Hokkaido University |
Principal Investigator |
本村 真人 北海道大学, 情報科学研究科, 教授 (90574286)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | リコンフィギュラブル / データマイニング / ビッグデータ |
Outline of Annual Research Achievements |
今年度は、MemcachedのNIC Cacheによる高速化手法の改良とハードウェア実装を中心に研究に取り組んだ。Memcachedは大規模データセンターなどでウェブサーバの応答を高速化するために用いられるデータベース技術であり、昨年度はMemcachedサーバのデータと処理の一部を同じサーバのNetwork Interface Card(NIC)においてキャッシュすることでMemcachedを高速化するシステムの有効性をソフトウェアシミュレーションにより検証した。今年度の課題は、①NIC上のキャッシュ容量が小さい問題を解決することと、②ハードウェア実装を行うことの2点であった。①の問題は、FPGA上のハッシュテーブルを実装するためのBlock RAMの容量が少ないことが原因であった。そこでハッシュテーブルに保持するタグの幅を減らすことでハッシュテーブルのエントリ数を増やし、同容量のBlock RAMでキャッシュ容量を増やす方法を考案した。また②の問題に関してはFPGA搭載NIC上に実装を進め、通常のソフトウェアによるMemcachedと比較して最大3.5倍のレイテンシ改善を達成した。FPGA搭載NICは、20Gbpsのネットワークインタフェース、FPGA(Virtex-5)、1GBのDRAMメモリ、そして20GbpsのPCI Expressを備えたものである。 また、NIC CacheのアーキテクチャをMemcached以外のアプリケーションに応用することを目指し、二つのアルゴリズムの処理アーキテクチャを検討した。一つはLocality Sensitive Hashing (LSH)と呼ばれる近傍探索アルゴリズムで、高速な画像検索に応用されている。もう一つは頻出アイテムセットのためのデータストリームマイニング(DSM-FI)と呼ばれるアルゴリズムで、購買履歴の分析などに用いられている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
Memcachedに関して、計画通り、フロントエンドコンピューティングのアーキテクチャを明確化し、かつこれをFPGA搭載NIC上で実機動作させることができた。また、次年度に向けて、他のフロントエンドコンピューティングターゲット応用の検討を進めることができた。
|
Strategy for Future Research Activity |
次年度はMemcachedにおいて有効性を検証したNIC Cacheによるサーバアプリケーション高速化手法を汎用的に昇華させた「フロントエンドコンピューティング」に向けて、現在アーキテクチャ検討段階にあるLSHおよびDSM-FIの両アルゴリズムをFPGA搭載NICに実装し、有効性を検証する。基盤となるFPGA評価環境は前年度に引き続きグリーンプラットフォーム研究所から貸与頂く予定である。 LSHは、類似したデータが近いハッシュ値となるハッシュ法で あり、その特性から大量のデータを高速に分類できるため、ビッグデータの処理に応用できる。これまでにもLSHをハードウェア実装し活用する研究は存在したが、特定のアプリケーションを想定して、決まった入力データを効率良く演算するよう演算部を最適化されていた。 したがって、特定の形式の入力データでしか使用できず、他のデータ形式に対応することが困難である 。このような問題を解決するため、用途によって変わる様々な次元の入力データに容易に対応できる拡張性を持つ LSHをNIC Cacheによって高速化する。 DSM-FIはオンラインデータマイニングにおける最も重要で基礎的な課題の一つである。既存手法では多くのメモリアクセスを必要とするため、CPUでの処理において、メモリアクセスがボトルネックになりがちである。この課題の解決を目指しFPGAを用いて頻出アイテムセットマイニングをNIC Cacheを用いて高速化を行う。
|
Causes of Carryover |
初年度は手持ちの物品で研究を進められることが予定より多かったため、若干の次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
次年度は、FPGA評価環境の充実により研究費を投入し、研究の加速に役立てていく所存である。
|