• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

データマイニングを加速する次世代リコンフィギュラブルアーキテクチャの創出

Research Project

Project/Area Number 15H02673
Research InstitutionHokkaido University

Principal Investigator

本村 真人  北海道大学, 情報科学研究科, 教授 (90574286)

Co-Investigator(Kenkyū-buntansha) 有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)
Project Period (FY) 2015-04-01 – 2019-03-31
Keywordsビッグデータ / データマイニング / ストリーム処理 / リコンフィギュラブル
Outline of Annual Research Achievements

ストリームデータ処理(CEP、ストリームマイニング等)はデータセンターにおける最先端情報処理の根幹技術として既に注目されているが、今後小型端末が爆発的に増殖するに従い、ネットワークに送出する手前でストリームデータトラフィックを減らす処理(=小型端末のスマート化)としても更に重要性を増すと予想される。すなわち、ネットワークの向こう側(データセンター)でも手前側(小型端末)でも、ストリームデータ処理はますますその重要性を高めていくと予想される。データセンターの高性能化・低電力化、および小型端末の低エネルギー化・環境負荷低減が社会的に大きな課題であることを考え合わせるならば、超高速・低電力なストリームデータ処理の実現を目指す研究の産業的な価値は極めて高いと言える。
このような問題意識のもと、今年度は、典型的かつ重要なストリームマイニング処理である頻出アイテムセットマイニング(Frequent ItemSet Mining: FISM)問題を題材に、FPGA実装を前提として、その最先端アルゴリズムのHWアーキテクチャの研究に注力した。特に、データベース関係の基幹学会であるSIGMOD2014で発表されたばかりで、特にストリーム向き高速・省メモリ指向の近似FISMアルゴリズムとして注目を集めているSkip LC-SSを研究対象として選び、このSkip LC-SSアルゴリズムを効率よくハードウェア化するための3つのハードウェア化要素技法について研究を進めた。また、データマイニングの一種である類似検索の比較的新しいアプローチとして注目されているLocality Sensitive Hashing (LSH)についてもそのHWアーキテクチャの研究を進めた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

まず、ハッシュテーブルをベースによりコンパクトかつ、探索が容易なアイテムセットの表現を考案した。長さ1 のアイテムセットに関しては従来の処理と変わらないが、長さ2 のアイテムセット(a, b) に関しては、そのままハッシュするのではなく、aをハッシュして得られたアドレス(固有の値) とb(新たなアイテム)をハッシュすることで、アイテムセットa, b がテーブル内に存在するかどうかを確認する。これにより、アドレスとアイテムが固定長であるため、いかなる大きさのトランザクションに対しても、ハッシュテーブルに保存されるデータは固定長となる。
次に、HWによるソートの実行は並列性が確保できないため性能上のボトルネックになりがちだという問題に関しては、ヒットしたアイテムに対してのみソートを行うことでその処理を簡略化し、パイプライン化することでソートを効率化した。この場合のソートは、ヒットしたアイテムセットのカウントを1 インクリメントし、元のカウントを持つアイテムセット群の一番上のアイテムセットとスワップを行うことになる。2つの情報を保持するメモリを分散させて書き込み優先で処理を行うことで、同一のメモリにアクセスが起きない場合はパイプライン処理が保たれるようにした。これによりマクロパイプラインにして、前段のハッシュテーブルでトランザクション内のアイテムセットがすべてヒットした場合にソート部がボトルネックになるという問題を解決した。
最後に、1トランザクションの処理毎にテーブルのアップデートが必要だというアルゴリズムの特性上並列性の確保が難しいという問題に対して、置換処理をトランザクション毎に行うのではなく、複数のトランザクションをバッチとして処理し、そこから生成される置換候補の中から頻出のものを探索し、バッチ終了時に現在のエントリテーブルと結合(置換)するというアプローチを考案した。

Strategy for Future Research Activity

FISMに関しては、今年度考案したFISMの新しいハードウェアアーキテクチャをFPGA上に実装し、その効果を実測するとともに、他のFISMアルゴリズムや他のデータマイニング処理への展開について検討する。また、いわゆるグラフマイニングの問題の効率的なハードウェアアーキテクチャの創出に向けて研究分野を拡大する。

  • Research Products

    (3 results)

All 2016 2015

All Presentation (3 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results)

  • [Presentation] Hardware architecture for online frequent items mining with memory-efficient data structure,2016

    • Author(s)
      Yamamoto K., Asai T., and Motomura M
    • Organizer
      COOL Chips XIX
    • Place of Presentation
      Yokohama Media & Communications Center, Yokohama, Japan
    • Year and Date
      2016-04-20 – 2016-04-22
    • Int'l Joint Research
  • [Presentation] 知的情報処理を加速するハードウェア技術2015

    • Author(s)
      本村真人
    • Organizer
      STARCフォーラム2015
    • Place of Presentation
      Shin Yokohama Hokusai Hotel, Yokohama, Japan
    • Year and Date
      2015-11-27 – 2015-11-27
    • Invited
  • [Presentation] An accelerator for frequent Itemset mining from data stream with parallel item tree2015

    • Author(s)
      Yamamoto K., Fukuda E.S., Asai T., and Motomura M
    • Organizer
      The 19th Workshop on Synthesis And System Integration of Mixed Information Technologies
    • Place of Presentation
      Evergreen Resort Hotel, Yilan, Taiwan
    • Year and Date
      2015-05-16 – 2015-05-17
    • Int'l Joint Research

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi