研究課題/領域番号 |
16K00298
|
研究機関 | 山梨大学 |
研究代表者 |
岩沼 宏治 山梨大学, 大学院総合研究部, 教授 (30176557)
|
研究分担者 |
山本 泰生 静岡大学, 情報学部, 准教授 (30550793)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | データマイニング / 負の相関ルール / オンライン型アルゴリズム / 近似計算 / 飽和集合 / 極小生成子 |
研究実績の概要 |
本年度は,負ルール集合の高速オンライン圧縮抽出に絶対的に必要となる2つの要素技術,即ち,負ルール集合の圧縮の核となる極小生成子の高速抽出法と,その母体となる飽和集合のオンライン高速抽出のためのデータ構造などの開発を行った.また併せて,仮説推論との融合を目指して,負の相関ルールを一般化した一般化相関ルールの高速マイニングに関する研究を精力的に行った. 前年度までの研究により,極小生成子を高速抽出するためには,アイテム集合の出現頻度計算がボトルネックになっていることが判明していた.このため本年度は,頻度計算を不要とする極小生成子の抽出原理を解明し,出現頻度計算を明示的には行わない抽出計算法を新たに開発した.性能評価実験により,一定の高速化が達成できたことが確認できた. 飽和集合のオンライン高速抽出には,飽和集合の圧縮保持と,圧縮したままの形式での集合積計算の高速化が絶対的に必要となる.このため,新しくFP-tree構造の拡張とその上のスキップ付き集合積計算法を開発し,圧縮データ長に関する線形時間での集合積計算を実現した.またより大きな飽和集合の抽出を効果的に行うためにサイズ制限機構を新しくオンライン計算に融合した. 仮説推論を導入する上で負の相関ルールの一般化は必須の要件である.そのため本年度は,正負のアイテムが混在するアイテム集合,即ち一般化アイテム集合に着目し,その基本的性質の解明と高速抽出法の開発を試みた.また正負の相関ルールの同時抽出のための枠組みと手法について研究を行った. 以上の研究について,国際会議において2件,国内研究会において4件の研究発表を行った.またこれまでの研究成果に関して,人工知能学会より2017年度研究会優秀賞を受賞している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初に予定していた研究計画は全体的に少し遅れているが,特に仮説推論の導入手法の開発が最も難航しており,そのためにシステム全体の開発が滞っている.仮説推論の導入のためには,飽和した一般化アイテム集合の高速抽出が必要不可欠であるが,その技術の開発が難しく,現在までのところ,当初の目標を達成できていないことが最大の原因である.今後,既存の飽和集合の線形抽出原理などを再度,詳細に検討し,一般化アイテム集合の理論的基盤を再検討する予定である.それらを通して,より高速な抽出法の開発につなげる予定である.
|
今後の研究の推進方策 |
仮説推論を導入するためには,正と負のアイテムが混在する一般化アイテム集合と,その飽和集合の高速抽出手法が必要不可欠である.今後,通常の飽和集合を線形時間抽出の原理として開発されている LCMアルゴリズムのprefix保存拡大法などを詳細に検討し,一般化アイテム集合の飽和集合の高速抽出のための理論的基盤を再構築する予定である.またそれらを踏まえて早期に,高速な抽出手法の開発を行う方針である.
|
次年度使用額が生じた理由 |
本研究では,これまで国際会議で2件,国内研究会で4件の研究発表を行い,人工知能学会の2017年度研究会優秀賞も受賞している.現在は,本研究の最新の研究成果を国際会議に投稿中である.査読を通った場合の会議参加費や旅費の支出は2019年度にならざるを得ない.また2019年度6月以降に,その他の研究成果も国内外の学会で発表する予定でおり,その旅費の支出を行うため,次年度使用額が生じた.
|