• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

潜在的規則の抽出を目的とした負の相関ルールの抽出の効率化と一般化

研究課題

研究課題/領域番号 19K12096
研究機関山梨大学

研究代表者

岩沼 宏治  山梨大学, 大学院総合研究部, 教授 (30176557)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードデータマイニング / 負の相関ルール / 潜在因子 / 一般化アイテム集合 / 極小生成子 / 強飽和集合 / 圧縮 / オンライン抽出
研究実績の概要

本研究では、巨大データに内在しながら表面的には見えない潜在的規則の効果的な抽出を目的として、負の相関ルールの効率的な抽出法について研究を行ってきた.具体的には以下の通りである.
(1)巨大データに潜在する負の相関ルールは莫大な数となるため,負ルール集合を圧縮・一般化して,少数の代表的なルールの集合として抽出することが重要である。そのため,我々は,極小生成子と飽和集合に基づく圧縮法を提案し研究を行ってきた.本年度はルール圧縮の基盤となる極小生成子を下方閉包性に基づき効果的に直接抽出する新しい手法の開発に成功している.実証実験の結果,密なデータに対して非常に効果的に働くことを確認している.
(2)上述の極小生成子に基づく負ルール集合の圧縮・一般化は,密なデータ上では非常に効果的であるが,疎なデータでは効果があまり無い.そこで我々は,飽和集合を一般化した強飽和集合に着目し、それに基づく負ルール集合の圧縮・一般化について研究を行った.強飽和集合は,通常の飽和集合よりも,現実の疎なデータの飽和性をよく表現する概念であり,極めて有用である.本年度は,強飽和集合の効果的な抽出法を開発するためにオフライン型とオンライン型の2つのタイプの高速アルゴリズムについて研究を行っている。
(3)現在までに提案されている負ルールでは,条件部あるいは結論部に正負のアイテムの混在を認めていないため,その表現能力に限界があり一般化が必要である.本研究では,正負のアイテムが混在する一般化アイテム集合を新しく提案し,本年度はオフライン型の効果的な抽出について研究を行った.まず一般化アイテム集合の飽和性について考察し,通常のアイテム集合よりも飽和性による圧縮・一般化が効果的に働くこと実証実験により明らかにした.次に拡張された接頭木探索の上に直接的に閉包計算を行う手法を開発し,実証実験により有用性を明らかにした.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

研究そのものは,上記の研究実績概要で説明したとおり概ね順調に進んでいるが,研究の取りまとめ作業が遅れてしまった.また新型コロナウイルス感染流行に伴い,年度末の多くの学会・研究集会が開催中止されたために,発表機会も限定されてしまった.今後,オンライン研究集会等に積極的に参加し,研究成果を発表していく予定である.

今後の研究の推進方策

以下のように研究を進めていく予定である
(1)我々が提案した極小生成子と飽和集合の対集合抽出アルゴリズムは,密なデータに関して効果的あるが,疎なデータに関して非効果的である.そのため新しく垂直配置型データベースの縮約方法の開発を行い,疎なデータに関する計算性能を向上させる予定である.また負ルールの新しい一般化手法として,ルールを条件部と結論部を分離して別の手法で圧縮一般化することを考察する予定である.
(2)強飽和集合は,疎なデータ上の頻出アイテム集合の強力な圧縮・一般化法であるが,これを用いた負ルールの表現とその抽出方法については殆ど考察されていない.今後,強飽和集合の高速抽出法を確立すると共に,強飽和集合と対の概念となる強極小生成子について考察を含め,負ルールの効果的な圧縮と一般化,およびその抽出法について研究を進めていく予定である.
(3)正負のアイテムが混在する一般化アイテム集合を用いた多様な負ルールの集合の効果的な抽出法の研究を行う.そのために一般化アイテム集合の飽和集合と極小生成子に基づく圧縮および一般化法などを考察し,それに基づく負ルールの抽出法について考察を進めていく予定である.

次年度使用額が生じた理由

2019年度末に3件の研究発表を予定していたが、学会が新型コロナウィルス感染流行のために相次いで中止となった。そのため出張旅費や学会参加費等が残額として残った。2020年度の幾つかの学会で発表を行う予定でおり、そのため参加費や出張旅費として使用する予定である。

  • 研究成果

    (4件)

すべて 2020 2019 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (2件) (うち国際学会 1件) 備考 (1件)

  • [雑誌論文] PARASOL: a hybrid approximation approach for scalable frequent itemset mining in streaming data2019

    • 著者名/発表者名
      Yoshitaka Yamamoto, Yasuo Tabei, Koji Iwanuma
    • 雑誌名

      Journal of Intelligent Information Systems

      巻: - ページ: -

    • DOI

      10.1007/s10844-019-00590-9

    • 査読あり / オープンアクセス
  • [学会発表] 閉包計算に基づく一般化飽和集合の高速な列挙法:相関ルールの一般化を目指して2020

    • 著者名/発表者名
      安藤 祐太,岩沼 宏冶
    • 学会等名
      人工知能学会 第112回人工知能基本問題研究会
  • [学会発表] Accelerating an On-Line Approximation Mining for Large Closed Itemsets2019

    • 著者名/発表者名
      Koji Iwanuma, Takumi Nishina, Yoshitaka Yamamoto
    • 学会等名
      2019 IEEE International Conference on Big Data (Big Data)
    • 国際学会
  • [備考] 負の相関ルールマイニングとオンライン近似計算

    • URL

      http://www.kki.yamanashi.ac.jp/~iwanuma/Kaken2019/

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi