• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

オンライン近似圧縮に基づく次世代ストリームデータマイニング法の開発

研究課題

研究課題/領域番号 17K00301
研究機関静岡大学

研究代表者

山本 泰生  静岡大学, 情報学部, 准教授 (30550793)

研究期間 (年度) 2017-04-01 – 2020-03-31
キーワードストリームデータ / 頻出系列パターンマイニング / オンラインアルゴリズム / 非可逆圧縮
研究実績の概要

計画にある以下の研究課題を実施した。
1. [B] アイテム集合系列マイニングの効率化: 半順序関係を満たすイベントストリーム上のオンライン頻出パターンマイニング法を提案し、その実装の改良と実証実験を行った (成果の一部は人工知能学会 SIGKBS研究会にて発表済)。パターンマイニングの計算における共通課題は解候補の組み合わせ爆発問題にある。この問題に対し提案法では、従来の近似アプローチ「パラメータ指向近似法」と「リソース指向近似法」を融合したハイブリット型の近似アプローチを導入することで定数時間計算量のリアルタイム処理を実現している。また半順序束の関係をもつ任意のパターン抽出に利用することが可能であり、この可用性の高さも特徴の一つである。現在、作成したソフトウェア (PARASOL) は、GitHub上にて公開している。
また、パターンマイニング法における近似解の精度向上を狙い、Random Samping に基づく確率的アプローチを導入する検討を行った。この検討の中で Membership query に対する Filtering 法の従来研究の調査と従来法である Bloom filter の可用性を検証する予備的実験を実施した。従来法はデータサイズ n に対し O(n) の空間計算量を要すが、高精度かつ高スケーラビリティなパターンマイニング法を実現するためには、この計算量を突破する``Sublinear'' な Filtering 法の開発が必要不可欠であることを確認した。
2. [B] 頻出パターンの基づくイベント発生予測: ベンチマーク問題における比較実験を昨年度から継続して行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

課題1に関してはほぼ当初の研究計画の通り遂行している。他方、パターンマイニング法のスケーラビリティを大きく改善できる可能性をもつ確率的アプローチの検討においては、本質的な課題と思われる membership filtering の空間計算量の壁に突き当たっており今年度中での解決には至っていない。

今後の研究の推進方策

Membership query filtering に関する調査検討を進めながら、系列予測への応用可能性 (課題2) を示すための実証評価を進める予定である。現在、省メモリ近傍探索法として知られる Compressed Hashing 法のアイデアを利用し、データサイズ によらない Membership query filtering を構成する手法を検討しており、この提案法の実証的な評価を行う予定である。

次年度使用額が生じた理由

所属先の異動に伴い、来年度に本研究課題の遂行に必要な物品 (計算サーバと開発用マシン) を購入する必要があり、今年度の支出を抑えて来年度に備えることとした。この金額は来年度の物品購入と実験環境の整備のため利用する予定である。

  • 研究成果

    (6件)

すべて 2019 2018 その他

すべて 雑誌論文 (3件) (うち査読あり 2件) 学会発表 (2件) 備考 (1件)

  • [雑誌論文] A Skipping FP-Tree for Incrementally Intersecting Closed Itemsets in On-Line Stream Mining2019

    • 著者名/発表者名
      Takumi Nishina, Koji Iwanuma, Yoshitaka Yamamoto
    • 雑誌名

      Proc. of BigComp2019

      巻: - ページ: 1-4

    • 査読あり
  • [雑誌論文] Approximate-Closed-Itemset Mining for Streaming Data Under Resource Constraint2018

    • 著者名/発表者名
      Yoshitaka Yamamoto, Yasuo Tabei, Koji Iwanuma
    • 雑誌名

      CoRR abs/1901.01710 (2019)

      巻: - ページ: 1-14

  • [雑誌論文] On-Line Approximation Mining for Frequent Closed Itemsets Greater than or Equal to Size K2018

    • 著者名/発表者名
      Takumi Nishina, Koji Iwanuma, Yoshitaka Yamamoto
    • 雑誌名

      Proc of BCD2018

      巻: - ページ: 61-66

    • 査読あり
  • [学会発表] 半順序ストリームデータのサマリ構築2018

    • 著者名/発表者名
      山本泰生, 岩沼宏治, 今井友輝
    • 学会等名
      人工知能学会知識ベースシステム研究会
  • [学会発表] 正負の相関ルールの妥当性の再考察と正負ルールの高速抽出手法2018

    • 著者名/発表者名
      雨宮晶良, 岩沼宏治, 谷島健斗, 山本泰生
    • 学会等名
      人工知能学会知識ベースシステム研究会
  • [備考] 公開ソフトウェア PARASOL (ver. 1.00)

    • URL

      https://github.com/Yoshitaka-Yamamoto/parasol

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi