研究課題/領域番号 |
11558030
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 展開研究 |
研究分野 |
計算機科学
|
研究機関 | 東京大学 |
研究代表者 |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
研究分担者 |
林 周志 東京大学, 生産技術研究所, 助手 (50282596)
中山 雅哉 東京大学, 情報基盤センター, 助教授 (90217943)
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
鳥居 俊一 日立製作所, ビジネスソリューション開発本部, 技術主幹
|
研究期間 (年度) |
1999 – 2000
|
研究課題ステータス |
完了 (2000年度)
|
配分額 *注記 |
13,600千円 (直接経費: 13,600千円)
2000年度: 6,500千円 (直接経費: 6,500千円)
1999年度: 7,100千円 (直接経費: 7,100千円)
|
キーワード | データマイニング処理 / 並列データベース処理 / 分散処理 / 並列データベース |
研究概要 |
本研究では、超並列相関ルールマイニングアルゴリズムを開発し、大規模並列コンピュータ(100プロセッサ)上に実現することで、その超高性能化を試み、従来、全く処理不能と考えられてきた巨大データのマイニングを可能とする基盤技術の実用化を目的とする。 平成11年度は、時系列データに対する概念階層を考慮した相関ルールマイニング並列処理アルゴリズムの設計を行ない,候補ルールに関してもハッシュ関数を利用して分散する新しい超並列化手法を提案した。また,数十台規模のPCクラスタを用いて予備実験を行なった。さらに概念階層と出現頻度を考慮した新しい実行時動的負荷分散手法の開発について検討を行った。 平成12年度は、概念階層を考慮した相関ルールマイニング並列処理アルゴリズムに関し、SQLによる記述を行い、PCクラスタおよび商用データベース上で実行することにより、我々の提案する並列データマイニングアルゴリズムの大規模データベースエンジンへの実用化の検討を行った。大規模PCクラスタ上のSQL処理系を用いたデータマイニングを実装し、直接C言語で記述されたデータマイニングプログラムと比較した。実際の実装を通じて、通常の相関ルールのマイニングに対して4ノードで階層関係を考慮するマイニングで6〜8ノードを用いればCによる実装と同じぐらいの処理速度が実現できることを確認した.さらに、C記述からSQLへの効率の低下割合などを検討することにより、SQLマイニングの有効性を明確にした。
|