• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

潜在的相関ルールマイニングと高次イベント系列コーパスの自動構築

Research Project

Project/Area Number 25330256
Research InstitutionUniversity of Yamanashi

Principal Investigator

岩沼 宏治  山梨大学, 総合研究部, 教授 (30176557)

Co-Investigator(Kenkyū-buntansha) 山本 泰生  山梨大学, 総合研究部, 助教 (30550793)
Project Period (FY) 2013-04-01 – 2017-03-31
Keywordsデータマイニング / 負の相関ルール / オンライン型アルゴリズム / 頻出アイテム集合 / 系列データ / データストリーム / 潜在因子発見 / 飽和アイテム集合
Outline of Annual Research Achievements

平成26年度は負の相関ルール抽出アルゴリズムの高速化を目的として研究を行ってきた.まず,多重データのストリームから負ルールの構成要素となる頻出アイテム集合を高速で抽出する手法について研究と開発を行った.多重データストリームは連続するアイテム集合の列,即ちトランザクションデータのストリームである.現実の多重ストリームではデータのバースト的な出現が頻繁に生じるが,そのようなデータストリームから頻出アイテム集合を即時抽出することは,組合せ爆発が生じるために極めて困難な問題である.本研究ではその解決のために,計算時間やメモリなどのリソースを指向した新しい計算制御機構を提案する.リソースの使用状況に基づく許容誤差の動的制御と適当的なデータスキップ機構を新しく開発し,頻出アイテム集合抽出のための新しいオンライン型近似アルゴリズムを提案した.有効性について理論的考察と実証的検証を行い,その研究成果をデータ工学の分野で世界最高レベルの国際会議 ACM-SIGMOD'14において正規(regular)論文として発表を行っている.
上の手法はストリーム中の頻出アイテム集合の候補に着目して処理を行っているが,これを飽和アイテム集合に変更すれば候補の数を更に削減でき,より効率的な抽出計算が行える可能性がある.そこで本研究では,次に,頻出飽和アイテム集合の候補を記録して処理を行うリソース指向型のオンライン型近似アルゴリズムを開発し,理論的な考察と実証的な検証を行い,有用性を確認した.
更に,より大量に出力される負の相関ルールの中から有効なルールだけを選別抽出するための評価基準を考察し,関連性尺度に着目し理論的考察を行った.また,これに基づき関連性尺度上昇法による探索空間の効果的な枝刈法を開発し,有効性基準で上位K個の負ルールを高速に抽出する手法を開発し,理論的考察と共に実証的な検証を行った.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初予定していた負の相関ルール抽出の高度化のため,負ルールの有用性評価尺度については,概ね計画通りに研究が進んでいる.この負ルールに対する有用性評価尺度の系統的な解析と応用はこれまでに例が無く,本研究が初めての試みと考えられる.また,負ルールの高速抽出のためのオンライン型アルゴリズムの開発するためには,負ルールの構成要素である頻出アイテム集合をオンラインでの高速抽出を実現することが絶対的な前提条件になる.これに対して,本年度はリソース指向型の高速オンライン型抽出アルゴリズムが開発できた.また本年度は更に,飽和アイテム集合のオンライン抽出の開発も達成できた.これらの研究成果により,負ルールの効率的な抽出に向けての本質的な改善を行えたと考えており,負ルールのオンライン抽出に向けての基盤を固めることができた.

Strategy for Future Research Activity

有効な負の相関ルールをより効率的に抽出するためには,頻出アイテム集合ではなく,その圧縮表現である飽和アイテム集合などを用いてルールを生成する必要がある.しかし,飽和アイテム集合だけを用いて負ルールの抽出を行った場合,抽出すべき一部の負ルールを表現することができず,結果として一部の有効な負ルールが抽出できなってしまうことが,予備研究により判明している.この問題を解決するために,現在,飽和アイテム集合の双対概念を用いた負ルールの新しい表現手法を検討している.今後,その新しい表現方法を用いた負ルールの効果的な抽出法の開発に取り組む予定である.これらを早期に達成した上で,多重データストリーム中の有効な負ルールのオンライン型抽出法を開発提案する予定である.オンライン型の負ルール抽出を達成する上での最後の課題は,有効な負ルールの探索に用いる接尾木のオンライン型の漸近的な構築と,その上での重複を極力抑えた探索法の開発である.これらについて今後,精力的な研究を進める予定である.
また,負ルールの有効性尺度は個々の応用問題によって適するものが異なると考えられる.今後,イベント系列コーパスを含めた幾つかの応用問題を想定して研究を進めていく予定である.

Causes of Carryover

平成26年度内に人工知能学科論文誌(査読付)に発表する予定であった論文の作成と投稿が遅れた.そのため,論文掲載費用相当額の支出が完了できなかっため,次年度使用額が生じた.

Expenditure Plan for Carryover Budget

上記の論文の研究は完了しており,現在,原稿を作成中である.平成27年度前期中の論文審査を合格した上で,論文誌への掲載を予定している.その掲載費用として支出する予定である.

  • Research Products

    (9 results)

All 2015 2014 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results,  Acknowledgement Compliant: 1 results) Presentation (7 results) Remarks (1 results)

  • [Journal Article] 負の相関ルールを抽出する高速トップダウン型アルゴリズム2015

    • Author(s)
      井出典子,岩沼 宏治,山本 泰生
    • Journal Title

      人工知能学会論文誌

      Volume: 29 Pages: 406-415

    • DOI

      http://doi.org/10.1527/tjsai.29.406

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] トランザクションストリーム上のオンライン型頻出飽和集合マイニング2015

    • Author(s)
      福田 翔士 , 岩沼 宏治 , 山本 泰生
    • Organizer
      人工知能基本問題研究会(第97回)
    • Place of Presentation
      別府ビーコンプラザ(別府市)
    • Year and Date
      2015-03-22 – 2015-03-23
  • [Presentation] 負相関ルールマイニングの高速化と関連性尺度の導入2015

    • Author(s)
      黒岩 健歩 , 岩沼 宏治 , 山本 泰生
    • Organizer
      人工知能基本問題研究会(第97回)
    • Place of Presentation
      別府ビーコンプラザ(別府市)
    • Year and Date
      2015-03-22 – 2015-03-23
  • [Presentation] Completing SBGN-AF Networks by Logic-Based Hypothesis Finding.2014

    • Author(s)
      Yoshitaka Yamamoto, Adrien Rougny, Hidetomo Nabeshima, Katsumi Inoue, Hisao Moriya, Christine Froidevaux and Koji Iwanuma
    • Organizer
      1st International Conference on Formal Methods in Macro-Biology (FMMB2014)
    • Place of Presentation
      Noume'a (New Caledonia)
    • Year and Date
      2014-09-22 – 2014-09-24
  • [Presentation] Resource-oriented Approximation for Frequent Itemset Mining from Bursty Data Streams2014

    • Author(s)
      Yoshitaka Yamamoto, Koji Iwanuma and Shoshi Fukuda
    • Organizer
      2014 ACM SIGMOD International Conference on Management of Data (SIGMOD'14)
    • Place of Presentation
      Snowbird, Utah, USA
    • Year and Date
      2014-06-22 – 2014-06-27
  • [Presentation] 関連尺度に基づいた負の相関ルール抽出手法の高機能化2014

    • Author(s)
      黒岩 健歩 , 岩沼 宏治 , 山本 泰生
    • Organizer
      人工知能学会全国大会(第28回)
    • Place of Presentation
      ひめぎんホール(松山市)
    • Year and Date
      2014-05-12 – 2014-05-15
  • [Presentation] 遺伝子発現データを用いた転写因子束縛ネットワークの状態推定2014

    • Author(s)
      平沼 祐人 , 山本 泰生 , 岩沼 宏治
    • Organizer
      人工知能学会全国大会(第28回)
    • Place of Presentation
      ひめぎんホール(松山市)
    • Year and Date
      2014-05-12 – 2014-05-15
  • [Presentation] フーリエ変換を用いた命題論理式の充足可能性に関する考察(第2報)2014

    • Author(s)
      宮城 智輝 , 山本 泰生 , 岩沼 宏治
    • Organizer
      人工知能学会全国大会(第28回)
    • Place of Presentation
      ひめぎんホール(松山市)
    • Year and Date
      2014-05-12 – 2014-05-15
  • [Remarks] 潜在的相関ルールマイニングの高度化と高速化および応用

    • URL

      http://www.kki.yamanashi.ac.jp/~iwanuma/Kaken2013

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi