2019 Fiscal Year Annual Research Report
An On-line Approximation Algorithm for Mining Latent Association Rules and its Integration with Hypothetical Reasoning
Project/Area Number |
16K00298
|
Research Institution | University of Yamanashi |
Principal Investigator |
岩沼 宏治 山梨大学, 大学院総合研究部, 教授 (30176557)
|
Co-Investigator(Kenkyū-buntansha) |
山本 泰生 静岡大学, 情報学部, 准教授 (30550793)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | データマイニング / 潜在的規則発見 / 負の相関ルール / 極小生成子 / オンライン計算 / 一般化アイテム集合 / 圧縮 / 拡張FP木 |
Outline of Annual Research Achievements |
本研究では,データストリームの中に隠れる潜在的法則の抽出を目的として,圧縮に基づくオンライン型の負ルール抽出のための幾つもの基盤技術を開発した.更により深いレベルに隠れる潜在因子や規則の抽出を目的として,正と負のルールを統一的に取り扱える一般化相関ルールを新しく提案し,それに基づく仮説推論技術の導入を試みた. 具体的には,まず極小生成子に基づく負ルール集合の圧縮原理について考察し,提案法の無損失圧縮性を理論的に証明した.また実証実験により密なデータセットに関して十分な圧縮性能を持つことを確認した.この極小生成子は高速な抽出が難しいために,次に飽和アイテム集合からの高速抽出法を研究した.新しく極小生成子の下方閉包性を発見し,これを用いた抽出法を提案した.実験の結果,アイテム集合の出現頻度計算が高速化の大きな障害であることが判明したので,頻度計算を陽に行わない高速抽出法を新たに開発した.以上の研究成果により人工知能学会2017年度研究会優秀賞を受賞した.これと並行して,極小生成子の母体となる飽和アイテム集合をデータストリームからオンライン高速抽出するための新し技術を開発した.オンライン抽出した多数の飽和アイテム集合を圧縮保持するためにHanらが開発したFP木を拡張し,圧縮した形のままで次の飽和集合の抽出計算(具体的には集合積計算)を可能にした.実証実験の結果,提案した拡張FP木は「疎と密の両方のデータを効果的に圧縮できる」という従来には無かった有用な特徴をもつことが確認できた. 仮説推論を導入する上で,相関ルールを正と負のアイテムが混在する形へ一般化することは必要不可欠である.そのために,その基盤となる正負のアイテムが混在する一般化アイテム集合の基本性質を解明し,また飽和性に基づく高速抽出法の開発した.更に一般化アイテム集合上の相関ルールの枠組みと高速抽出法を提案した.
|