配分額 *注記 |
9,950千円 (直接経費: 9,200千円、間接経費: 750千円)
2007年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2006年度: 2,600千円 (直接経費: 2,600千円)
2005年度: 4,100千円 (直接経費: 4,100千円)
|
研究概要 |
二分決定グラフ(BDD)は,大規模論理関数を主記憶上に効率よく表現するデータ構造であり,1990年頃より,主にVLSI設計自動化の分野で盛んに研究開発されてきた.近年,このBDDが,データマイニング・知識発見の分野においても活用できることがわかってきた.特に,ゼロサプレス型BDD(ZBDD)と呼ばれるタイプのBDDは,疎な組合せ集合を効率よく扱うことができるため,現実に扱われる多くのデータベースの解析処理に適している.本研究では,ZBDDを用いた大規模データベース解析処理アルゴリズムの研究を進めた。主な研究成果は以下の通りである。 1.研究協力者の宇野らが以前に開発した世界最高速の頻出アイテム集合抽出アルゴリズム「LCM」とZBDDの技術を結合させた「LCM over ZBDDs」を開発した。出力データをZBDDで圧縮して取り出すことにより、さらに大幅に計算時間を削減することに成功した。さらにZBDDは変数順序づけにより性能が大きく変化するため、頻出パタンマイニングにおいて,比較的良い順序付けを見つける手法を開発した。 2.データに内包されている隠れた構造情報を取り出すことを目的とし、VLSI CADの分野で知られている独立変数、および対称変数を検出する技術をデータベース解析に応用する方法を提案した.さらにこれを一般化した「共起成分の含意関係」(Cofactor Implication)と呼ぶアイテムの関係を定義した。ZBDDを用いて、そのような性質を持つアイテムの組を高速に抽出し列挙するアルゴリズムを開発した。 3.本研究計画を通して,データベース解析/データマイニング処理で必要となる様々な演算を整理検討した上で,現在普及している32ビット計算機だけでなく大規模な主記憶を持つ64ビット計算機でも効果的に使用可能な北大版BDD/ZBDD処理系を開発し、国内外に開示・提供を行った.
|