研究課題/領域番号 |
17K00301
|
研究機関 | 静岡大学 |
研究代表者 |
山本 泰生 静岡大学, 情報学部, 准教授 (30550793)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | ストリームデータ / 頻出系列パターンマイニング / オンラインアルゴリズム / 非可逆圧縮 |
研究実績の概要 |
計画にある以下の研究課題を実施した。 1. [B] アイテム集合系列マイニングの効率化: 半順序関係を満たすイベントストリーム上のオンライン頻出パターンマイニング法を提案し、その実装の改良と実証実験を行った (成果の一部は人工知能学会 SIGKBS研究会にて発表済)。パターンマイニングの計算における共通課題は解候補の組み合わせ爆発問題にある。この問題に対し提案法では、従来の近似アプローチ「パラメータ指向近似法」と「リソース指向近似法」を融合したハイブリット型の近似アプローチを導入することで定数時間計算量のリアルタイム処理を実現している。また半順序束の関係をもつ任意のパターン抽出に利用することが可能であり、この可用性の高さも特徴の一つである。現在、作成したソフトウェア (PARASOL) は、GitHub上にて公開している。 また、パターンマイニング法における近似解の精度向上を狙い、Random Samping に基づく確率的アプローチを導入する検討を行った。この検討の中で Membership query に対する Filtering 法の従来研究の調査と従来法である Bloom filter の可用性を検証する予備的実験を実施した。従来法はデータサイズ n に対し O(n) の空間計算量を要すが、高精度かつ高スケーラビリティなパターンマイニング法を実現するためには、この計算量を突破する``Sublinear'' な Filtering 法の開発が必要不可欠であることを確認した。 2. [B] 頻出パターンの基づくイベント発生予測: ベンチマーク問題における比較実験を昨年度から継続して行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
課題1に関してはほぼ当初の研究計画の通り遂行している。他方、パターンマイニング法のスケーラビリティを大きく改善できる可能性をもつ確率的アプローチの検討においては、本質的な課題と思われる membership filtering の空間計算量の壁に突き当たっており今年度中での解決には至っていない。
|
今後の研究の推進方策 |
Membership query filtering に関する調査検討を進めながら、系列予測への応用可能性 (課題2) を示すための実証評価を進める予定である。現在、省メモリ近傍探索法として知られる Compressed Hashing 法のアイデアを利用し、データサイズ によらない Membership query filtering を構成する手法を検討しており、この提案法の実証的な評価を行う予定である。
|
次年度使用額が生じた理由 |
所属先の異動に伴い、来年度に本研究課題の遂行に必要な物品 (計算サーバと開発用マシン) を購入する必要があり、今年度の支出を抑えて来年度に備えることとした。この金額は来年度の物品購入と実験環境の整備のため利用する予定である。
|