• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

オンライン近似圧縮に基づく次世代ストリームデータマイニング法の開発

Research Project

Project/Area Number 17K00301
Research InstitutionShizuoka University

Principal Investigator

山本 泰生  静岡大学, 情報学部, 准教授 (30550793)

Project Period (FY) 2017-04-01 – 2020-03-31
Keywordsストリームデータ / 頻出系列パターンマイニング / オンラインアルゴリズム / 非可逆圧縮
Outline of Annual Research Achievements

計画にある以下の研究課題を実施した。
1. [B] アイテム集合系列マイニングの効率化: 半順序関係を満たすイベントストリーム上のオンライン頻出パターンマイニング法を提案し、その実装の改良と実証実験を行った (成果の一部は人工知能学会 SIGKBS研究会にて発表済)。パターンマイニングの計算における共通課題は解候補の組み合わせ爆発問題にある。この問題に対し提案法では、従来の近似アプローチ「パラメータ指向近似法」と「リソース指向近似法」を融合したハイブリット型の近似アプローチを導入することで定数時間計算量のリアルタイム処理を実現している。また半順序束の関係をもつ任意のパターン抽出に利用することが可能であり、この可用性の高さも特徴の一つである。現在、作成したソフトウェア (PARASOL) は、GitHub上にて公開している。
また、パターンマイニング法における近似解の精度向上を狙い、Random Samping に基づく確率的アプローチを導入する検討を行った。この検討の中で Membership query に対する Filtering 法の従来研究の調査と従来法である Bloom filter の可用性を検証する予備的実験を実施した。従来法はデータサイズ n に対し O(n) の空間計算量を要すが、高精度かつ高スケーラビリティなパターンマイニング法を実現するためには、この計算量を突破する``Sublinear'' な Filtering 法の開発が必要不可欠であることを確認した。
2. [B] 頻出パターンの基づくイベント発生予測: ベンチマーク問題における比較実験を昨年度から継続して行った。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

課題1に関してはほぼ当初の研究計画の通り遂行している。他方、パターンマイニング法のスケーラビリティを大きく改善できる可能性をもつ確率的アプローチの検討においては、本質的な課題と思われる membership filtering の空間計算量の壁に突き当たっており今年度中での解決には至っていない。

Strategy for Future Research Activity

Membership query filtering に関する調査検討を進めながら、系列予測への応用可能性 (課題2) を示すための実証評価を進める予定である。現在、省メモリ近傍探索法として知られる Compressed Hashing 法のアイデアを利用し、データサイズ によらない Membership query filtering を構成する手法を検討しており、この提案法の実証的な評価を行う予定である。

Causes of Carryover

所属先の異動に伴い、来年度に本研究課題の遂行に必要な物品 (計算サーバと開発用マシン) を購入する必要があり、今年度の支出を抑えて来年度に備えることとした。この金額は来年度の物品購入と実験環境の整備のため利用する予定である。

  • Research Products

    (6 results)

All 2019 2018 Other

All Journal Article (3 results) (of which Peer Reviewed: 2 results) Presentation (2 results) Remarks (1 results)

  • [Journal Article] A Skipping FP-Tree for Incrementally Intersecting Closed Itemsets in On-Line Stream Mining2019

    • Author(s)
      Takumi Nishina, Koji Iwanuma, Yoshitaka Yamamoto
    • Journal Title

      Proc. of BigComp2019

      Volume: - Pages: 1-4

    • Peer Reviewed
  • [Journal Article] Approximate-Closed-Itemset Mining for Streaming Data Under Resource Constraint2018

    • Author(s)
      Yoshitaka Yamamoto, Yasuo Tabei, Koji Iwanuma
    • Journal Title

      CoRR abs/1901.01710 (2019)

      Volume: - Pages: 1-14

  • [Journal Article] On-Line Approximation Mining for Frequent Closed Itemsets Greater than or Equal to Size K2018

    • Author(s)
      Takumi Nishina, Koji Iwanuma, Yoshitaka Yamamoto
    • Journal Title

      Proc of BCD2018

      Volume: - Pages: 61-66

    • Peer Reviewed
  • [Presentation] 半順序ストリームデータのサマリ構築2018

    • Author(s)
      山本泰生, 岩沼宏治, 今井友輝
    • Organizer
      人工知能学会知識ベースシステム研究会
  • [Presentation] 正負の相関ルールの妥当性の再考察と正負ルールの高速抽出手法2018

    • Author(s)
      雨宮晶良, 岩沼宏治, 谷島健斗, 山本泰生
    • Organizer
      人工知能学会知識ベースシステム研究会
  • [Remarks] 公開ソフトウェア PARASOL (ver. 1.00)

    • URL

      https://github.com/Yoshitaka-Yamamoto/parasol

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi