• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

潜在的相関ルール抽出を目的したオンライン型近似計算法の開発と仮説推論との統合

研究課題

研究課題/領域番号 16K00298
研究機関山梨大学

研究代表者

岩沼 宏治  山梨大学, 大学院総合研究部, 教授 (30176557)

研究分担者 山本 泰生  山梨大学, 大学院総合研究部, 助教 (30550793)
研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードデータマイニング / 負の相関ルール / オンライン型アルゴリズム / 近似計算 / 飽和集合 / 極小生成子 / アイテム集合系列
研究実績の概要

平成29年度では,負の相関ルールの集合をオンライン圧縮抽出する手法について研究を行い,特にルール集合の圧縮の核となる極小生成子の高速抽出と,ルール集合の台となる飽和集合のオンライン高速抽出に関して研究を行った.極小生成子の抽出に関する研究は高く評価され,2017年度人工知能学会研究会優秀賞の受賞が決定している.
極小生成子は負ルール集合の圧縮抽出の核となるが,高速な抽出が難しい.そこで極小生成子を飽和アイテム集合から高速に抽出する手法について研究を行った.極小生成子は飽和集合の部分集合であるので,飽和集合のべき集合空間を探索して抽出を行う3種類の高速抽出アルゴリズム(下降型,上昇型および混合型)を開発した.その理論的性質の考察を通して幾つかの新しい枝刈原理を発見し,抽出プログラムへ実装し,評価実験によって3種類の抽出アルゴリズムのそれぞれの特性と有用性を明らかにした.これらの実験の結果,抽出計算におけるボトルネックは,アイテム集合の頻度計算の部分にあることが明らかになった.そのため,飽和集合に対する極小生成子の特性を新たに解明し,それを用いて,頻度計算を陽に行わない極小生成子の抽出法を新たに開発した.性能評価実験の結果,良好な性能を確認することができた.
また極小生成子の母体となる飽和アイテム集合を高速抽出するために,新しいデータ構造を開発した.高速化するためには,抽出した多数の飽和アイテム集合上の集合積演算の高速化が絶対的に必要となるので,それを支えるデータ構造が重要となる.従来法ではトライ木等を用いていたが,本研究ではHanらがトランザクション集合の高速絞込みを目的として開発したFP木に着目し,スキップ処理を効果的に行うためにデータ構造を拡張し,集合積計算の高速化を図った.本データ構造は疎なデータと密なデータの両方に効果的に働くという従来には無かった有用な特徴をもつ.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

当初に予定していた研究計画のうち,負の相関ルールの集合を圧縮抽出するオンライン近似アルゴリズムの開発は,その要素技術の改良開発が難航し,それらを統合した全体システムの開発改良に関する研究が滞ってしまった.負ルール集合の高速オンライン圧縮抽出に絶対的に必要となる2つの要素技術,即ち,負ルール集合の圧縮の核となる極小生成子の高速抽出法と,その母体となる飽和集合のオンライン高速抽出のデータ構造などの要素技術の開発が難しく,当初予定した計画の全てが実施できなかったものである.また負ルール集合の更なる圧縮を目指した非可逆圧縮手法に関しては,オンライン近似計算の代表的な手法であるLossy-Counting法のε削除手法の本質的な拡張を目標としてきた.鋭意,研究を行い,本質的な拡張を行うための基本的なアイディアや原理の提案,およびそれを支える幾つかの技術については一定の目途を立てることができた.しかし残念ながら,その性能評価用の実証プログラムの開発が難航して,対外発表に至らなかった.

今後の研究の推進方策

負の相関ルールの集合をオンライン抽出するシステムは,α版は既に試作してある.今後は昨年度までに得られた幾つかの研究結果を生かして,抽出アルゴリズムと試作抽出システムの改良をはかり,α版システムを改良して行く予定である.また負ルール集合の非可逆圧縮についても,前年度の研究を発展・精密化させて,Manku & MotwaniのLossy-Counting のε削除&圧縮手法の本質的な改善を図る予定である.また平成30年度は研究計画の最終年度でもあることから,仮説推論との統合のために,背景知識となる確信度100%の正負の相関ルールの高速抽出などの,当初に予定していた課題についても,鋭意研究を行っていく予定である.

次年度使用額が生じた理由

平成29年度内に国際会議および論文誌に発表予定であった複数の論文の作成と投稿が遅れた.そのために予定していた発表費用相当額の支出が完了できなかった.このうち,本報告書を作成している時点で,一つの論文は既に論文作成と国際会議への投稿と審査(結果はaccept)が完了している.今年7月に正式に対外発表する予定であり,平成29年度の研究費残額の一部を発表費用として支出する計画である.その他の論文についても現在,鋭意,研究の仕上げ作業および執筆作業等を進めており,それらが完成次第,順次,国際会議や論文誌に投稿をする予定である.今年度への繰越金をそれらの発表費用にあてる予定である.

  • 研究成果

    (7件)

すべて 2018 2017 その他

すべて 学会発表 (6件) (うち国際学会 1件) 備考 (1件)

  • [学会発表] Frequent Closed Itemsets More than Size K and Its On-Line Approximation Mining2018

    • 著者名/発表者名
      Takumi Nishina, Koji Iwanuma and Yoshitaka Yamamoto
    • 学会等名
      3rd International Conference on Big Data, Cloud Computing, and Data Science Engineering (BCD 2018)
    • 国際学会
  • [学会発表] 逆順走査FP木とトライ木を併用したストリーム上の飽和集合のオンライン抽出2018

    • 著者名/発表者名
      仁科拓巳,岩沼宏冶,山本泰生
    • 学会等名
      人工知能学会 第106回人工知能基本問題研究会
  • [学会発表] 飽和集合上の極小生成子の支持度計算を行わない高速抽出ー負の相関ルール抽出の効率化に向けてー2018

    • 著者名/発表者名
      谷島健斗 岩沼宏冶 山本泰生
    • 学会等名
      人工知能学会 第106回人工知能基本問題研究会
  • [学会発表] トランザクションストリーム上の頻出飽和アイテム集合系列の抽出に関する基礎的考察2017

    • 著者名/発表者名
      仁科 拓巳,山本 泰生,岩沼 宏治
    • 学会等名
      2017年度人工知能学会全国大会(第31回)
  • [学会発表] 極小生成子を用いた負ルール抽出計算の効率化2017

    • 著者名/発表者名
      谷島 健斗,岩沼 宏治,黒岩 健歩,佐生 隼一, 山本 泰生
    • 学会等名
      2017年度人工知能学会全国大会(第31回)
  • [学会発表] 負の相関ルールマイニングの効率化のための飽和アイテム集合からの極小生成子の高速抽出2017

    • 著者名/発表者名
      谷島健斗,岩沼宏冶,山本泰生
    • 学会等名
      人工知能学会 第112回知識ベース研究会
  • [備考] 負の相関ルールマイニングとオンライン近似計算

    • URL

      http://www.kki.yamanashi.ac.jp/~iwanuma/Kaken2017/

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi