2011 Fiscal Year Annual Research Report
系列データマイニングと高次推論の統合による大規模テキスト時系列からの知識発見
Project/Area Number |
22500127
|
Research Institution | University of Yamanashi |
Principal Investigator |
岩沼 宏治 山梨大学, 大学院・医学工学総合研究部, 教授 (30176557)
|
Co-Investigator(Kenkyū-buntansha) |
山本 泰生 山梨大学, 大学院・医学工学総合研究部, 助教 (30550793)
|
Keywords | 系列データマイニング / テキスト / 圧縮 / 仮説推論 / オンラインアルゴリズム / 情報量 / 学習 |
Research Abstract |
平成23年度は主に以下の2つの課題に取り組んだ 1.負のパターンの概念に基づく興味深い相関パターンの抽出: 2.より実用的な時系列データの取り扱いを目的とした,多重頻出系列を抽出する高速オンライン型近似アルゴリズムの開発: まず課題1で取り組む負の相関パターンの抽出は種々の応用において極めて重要である.先行研究で提案された抽出アルゴリズムはどれも完全性が保証されない.また正と負の相関パターンを同時並行的に抽出することから,その過程で負の頻出アイテム集合を一部抽出し,効率が悪い.本研究では新たに完全かつ負の相関ルールを抽出しない高速アルゴリズムを開発提案し,予備的な評価実験を行い,その性能を確認した. 次に課題2であるが大規模な単一系列データから効果的な系列マイニングを行うために、データのバースト的な出現を効果的に取り扱えるオンライン型近似アルゴリズムを開発した.具体的には,予想される莫大な空間計算量を大幅に縮減するために,蓄積データ交換型のメモリ制限機構を新しく開発し、提案アルゴリズムを実装の上で性能評価実験を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね,当初の目的を達成するアルゴリズムを開発し,性能評価のための実証実験も予備的なものではあるが完了している.
|
Strategy for Future Research Activity |
研究課題を遂行する上では,特に大きな問題点は無く,研究計画の大きな変更は無い.
|