2023 Fiscal Year Annual Research Report
潜在的規則の抽出を目的とした負の相関ルールの抽出の効率化と一般化
Project/Area Number |
19K12096
|
Research Institution | University of Yamanashi |
Principal Investigator |
岩沼 宏治 山梨大学, 大学院総合研究部, 教授 (30176557)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 負の相関ルール / 潜在因子 / 圧縮 / 極小生成子 / 強飽和集合 / 一般化アイテム集合 / オンラインアルゴリズム / データマイニング |
Outline of Annual Research Achievements |
本研究では,巨大データに潜在するルール型知識の効果的な抽出を目的として,負の相関ルールの効率的な抽出法について研究を行ってきた.最終年度に実施した主な研究は以下の2項目である. (1)負ルール集合を圧縮するための極小生成子を,高速性を保ちつつより少ないメモリで効果的に列挙抽出するアルゴリズムの開発 (2)極小生成子の集合を更に圧縮するすために必要なε近似分位数の高速抽出を目的としたオンライン型分位数サマリ構築アルゴリズムの開発. 研究期間全体を通じて,負ルール集合の多段階圧縮のための幾つかの圧縮原理と,圧縮を行いながら負ルール集合を高速に抽出するための計算技法とアルゴリズムを開発した.一般に,ルール集合の圧縮は多数のルールを一般化・抽象化して本質的に重要なルールを求めることを意味しており極めて重要である.より具体的には,まず負ルールの基底をなす頻出アイテム集合の集合を圧縮するための幾つかの手法を開発した.極小生成子に着目し,理論的な性質を考察すると共に,その高速列挙を行う省メモリな手法を幾つか開発している.また極小生成子集合を更に圧縮する手法として強飽和集合に着目し,そのオンライン型高速列挙法を開発している.同時に強飽和集合とは別種の圧縮原理となりえるε近似分位数に着目し,その近似誤差を軽減するカウンタを用いたオンライン型高速列挙法の開発を行っている.更に,負ルールそのものを高速に圧縮抽出する目的で,極小生成子の下方閉包性を利用した列挙木上での負ルールを高速に直接列挙するための探索枝刈手法を開発している.負ルールの表現能力を本質的に上げる目的で,正負のアイテムが混在する一般化アイテム集合とその圧縮と高速抽出についても研究を行った.
|