研究課題/領域番号 |
25330256
|
研究機関 | 山梨大学 |
研究代表者 |
岩沼 宏治 山梨大学, 総合研究部, 教授 (30176557)
|
研究分担者 |
山本 泰生 山梨大学, 総合研究部, 助教 (30550793)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | データマイニング / 負の相関ルール / オンライン型アルゴリズム / 近似計算 / 飽和アイテム集合 / 極小生成子 / アイテム集合系列 / 潜在因子発見 |
研究実績の概要 |
最終年度は当初の研究期間を1年延長したものであり,前年度までに得た研究成果を学会論文誌等に発表するための活動を主に行った.結果として,2本の査読付き論文を発表することができた. 研究期間全体を通しての成果は以下の通りである.本研究の目的は「新しい相関ルールマイニングとしての潜在的相関ルールマイニングの提案と,そのイベント系列コーパスの半自動合成への応用」であった.負の相関ルールは潜在的相関ルールの実現形式として非常に良い性質を持つことから,我々は負の相関ルールの効果的かつ高速なマイニング技術の開発を行った.負ルールは,正の相関ルールに比べても,その数が極めて多いために高速化と圧縮の技術は極めて重要となる.我々は高速化のために,頻出アイテム集合上の接頭辞木を用いる深さ優先探索法と,負ルールの極小性や評価値の逆単調な上界関数を用いる枝刈り法を新しく開発している.また新しい圧縮法として,極小生成子を用いた負ルール集合の圧縮技術を開発している.理論的ならびに実証的な検証を行い,良好な性能を確認している. イベント系列コーパスを自動生成するためには,膨大な時系列テキストデータを効果的に処理する必要がある.また現在のネットワーク社会においてもストリームデータのオンライン処理は非常に重要な課題であるため,本研究では,ストリームデータ中の負の相関ルールのオンライン抽出についても研究を進めた.負ルールの台集合対となる頻出飽和アイテム集合をストリームからオンラインでの抽出が最初の課題となるが,我々は,オンライン処理中の組み合せ爆発の発生を回避するために,計算時間やメモリ等のリソースを考慮して適応的にオンライン近似計算を制御する機構を新たに開発した.本研究成果はデータ工学のトップの国際会議である ACM SIGMOD2014に regular paper として採録されたことを特記しておく.
|