研究課題/領域番号 |
25330256
|
研究機関 | 山梨大学 |
研究代表者 |
岩沼 宏治 山梨大学, 総合研究部, 教授 (30176557)
|
研究分担者 |
山本 泰生 山梨大学, 総合研究部, 助教 (30550793)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | データマイニング / 負の相関ルール / オンライン型アルゴリズム / 頻出アイテム集合 / 系列データ / データストリーム / 潜在因子発見 / 飽和アイテム集合 |
研究実績の概要 |
平成26年度は負の相関ルール抽出アルゴリズムの高速化を目的として研究を行ってきた.まず,多重データのストリームから負ルールの構成要素となる頻出アイテム集合を高速で抽出する手法について研究と開発を行った.多重データストリームは連続するアイテム集合の列,即ちトランザクションデータのストリームである.現実の多重ストリームではデータのバースト的な出現が頻繁に生じるが,そのようなデータストリームから頻出アイテム集合を即時抽出することは,組合せ爆発が生じるために極めて困難な問題である.本研究ではその解決のために,計算時間やメモリなどのリソースを指向した新しい計算制御機構を提案する.リソースの使用状況に基づく許容誤差の動的制御と適当的なデータスキップ機構を新しく開発し,頻出アイテム集合抽出のための新しいオンライン型近似アルゴリズムを提案した.有効性について理論的考察と実証的検証を行い,その研究成果をデータ工学の分野で世界最高レベルの国際会議 ACM-SIGMOD'14において正規(regular)論文として発表を行っている. 上の手法はストリーム中の頻出アイテム集合の候補に着目して処理を行っているが,これを飽和アイテム集合に変更すれば候補の数を更に削減でき,より効率的な抽出計算が行える可能性がある.そこで本研究では,次に,頻出飽和アイテム集合の候補を記録して処理を行うリソース指向型のオンライン型近似アルゴリズムを開発し,理論的な考察と実証的な検証を行い,有用性を確認した. 更に,より大量に出力される負の相関ルールの中から有効なルールだけを選別抽出するための評価基準を考察し,関連性尺度に着目し理論的考察を行った.また,これに基づき関連性尺度上昇法による探索空間の効果的な枝刈法を開発し,有効性基準で上位K個の負ルールを高速に抽出する手法を開発し,理論的考察と共に実証的な検証を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初予定していた負の相関ルール抽出の高度化のため,負ルールの有用性評価尺度については,概ね計画通りに研究が進んでいる.この負ルールに対する有用性評価尺度の系統的な解析と応用はこれまでに例が無く,本研究が初めての試みと考えられる.また,負ルールの高速抽出のためのオンライン型アルゴリズムの開発するためには,負ルールの構成要素である頻出アイテム集合をオンラインでの高速抽出を実現することが絶対的な前提条件になる.これに対して,本年度はリソース指向型の高速オンライン型抽出アルゴリズムが開発できた.また本年度は更に,飽和アイテム集合のオンライン抽出の開発も達成できた.これらの研究成果により,負ルールの効率的な抽出に向けての本質的な改善を行えたと考えており,負ルールのオンライン抽出に向けての基盤を固めることができた.
|
今後の研究の推進方策 |
有効な負の相関ルールをより効率的に抽出するためには,頻出アイテム集合ではなく,その圧縮表現である飽和アイテム集合などを用いてルールを生成する必要がある.しかし,飽和アイテム集合だけを用いて負ルールの抽出を行った場合,抽出すべき一部の負ルールを表現することができず,結果として一部の有効な負ルールが抽出できなってしまうことが,予備研究により判明している.この問題を解決するために,現在,飽和アイテム集合の双対概念を用いた負ルールの新しい表現手法を検討している.今後,その新しい表現方法を用いた負ルールの効果的な抽出法の開発に取り組む予定である.これらを早期に達成した上で,多重データストリーム中の有効な負ルールのオンライン型抽出法を開発提案する予定である.オンライン型の負ルール抽出を達成する上での最後の課題は,有効な負ルールの探索に用いる接尾木のオンライン型の漸近的な構築と,その上での重複を極力抑えた探索法の開発である.これらについて今後,精力的な研究を進める予定である. また,負ルールの有効性尺度は個々の応用問題によって適するものが異なると考えられる.今後,イベント系列コーパスを含めた幾つかの応用問題を想定して研究を進めていく予定である.
|
次年度使用額が生じた理由 |
平成26年度内に人工知能学科論文誌(査読付)に発表する予定であった論文の作成と投稿が遅れた.そのため,論文掲載費用相当額の支出が完了できなかっため,次年度使用額が生じた.
|
次年度使用額の使用計画 |
上記の論文の研究は完了しており,現在,原稿を作成中である.平成27年度前期中の論文審査を合格した上で,論文誌への掲載を予定している.その掲載費用として支出する予定である.
|