2018 Fiscal Year Research-status Report
Expansion of efficient search and discovery technology for processing massive data stream in the real world
Project/Area Number |
18K19771
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
トーマス ツォイクマン 北海道大学, 情報科学研究科, 教授 (60374609)
喜田 拓也 北海道大学, 情報科学研究科, 准教授 (70343316)
|
Project Period (FY) |
2018-06-29 – 2021-03-31
|
Keywords | ストリームデータ処理 / データマイニング / 情報検索 / 大規模並列列挙 / 文脈性 / 並列ソルバー / 多重性 |
Outline of Annual Research Achievements |
本申請課題では,多様で膨大な実世界時空間ストリームデータに対する高速大規模な知識処理の基盤となる超高速な検索・発見技術の研究開発を行った. 本年度は,次の結果を得た. (a)多様で膨大な実世界時空間ストリームデータから,特徴的なパターンや規則性を検索・発見する超高速な検索・発見技術の基礎技術を開発した.(a.i) RMSD距離に対して,3次元点集合マッチングに対する効率良いオフライン照合アルゴリズムを与えた(Sasaki et al. IEICE Trasn).(a.ii) ストリームからの学習の理論的モデルである正データからの帰納推論に,検証と比較が可能な新しいモデルを導入し,そのストリームからの学習可能性を明らかにした (Gao et al. ALT2018).(a.iii) ビット詰め込みを用いて小さなサイズで格納可能な圧縮データ構造DenseZDDとその高速検索アルゴリズムを開発した(Denzumi et al., Algorithms).(a.iv) 理論計算機科学の学術誌であるTCS誌にて,データからの学習可能性と計算量に関する論文特集を企画・掲載した. (b) 実績世界時空間ストリーム上で,複雑な構造パターンに対して,適応性・文脈性・低メモリ性・高速性を満足する知識の検索・発見技術を開発した. (b.i)グラフコード のトライであるグラフ断片決定木を用いた多様で小さな高精度のパターン集合を構築する軽量手法を開発した(坂上他,JSAI2018).(b.ii)系列データに対するグラフパターンである菱形エピソードの族に対し,統計的な有意性を考慮した効率良いデータマイニング手法を開発した. (c)実世界情報からの知識獲得のためのアーキテクチャの研究開発については,項目(a)と項目(b)で開発した各種アルゴリズムの実装,理論的実証的解析を行ない,開発にフィードバックした.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は,項目(a) の多様で膨大な実世界時空間ストリームデータを対象とした特徴的なパターンや規則性の検索・発見については,組合せパターンに対する高速な検索手法や,ストリームデータに対する学習モデルの提案と理論的解析,発見した組合せパターンの効率良い格納法など,順調に進捗している.また成果の啓蒙に貸しては,データからの学習可能性と計算量に関する論文特集を企画している. 項目(b) の複雑な構造パターンに対して,適応性・文脈性・低メモリ性・高速性を満足する知識の検索・発見技術については,グラフ断片決定木の軽量学習アルゴリズムの開発や,エピソードパターンの族に対するマイニングアルゴリズムの開発など順調に進んでいる.項目(c)の実世界情報からの知識獲得のためのアーキテクチャの研究開発については,各種アルゴリズムの実装を都度行い,順調に進んでいる.
|
Strategy for Future Research Activity |
今後の方策として,(a)については,3次元点集合マッチングに関してはストリーム化を行う.ストリーム学習の理論的モデルに関しては,実際の応用シナリオを検討して,検証と比較以外の演算を許した新しいモデルを検討する.圧縮データ構造DenseZDDを利用した集約計算を研究する.(b)については,グラフ断片決定木のストリームを化を行い,そこで得られた構造特徴を用いたオンライン学習器の構築法を研究開発する.菱形エピソードの族を階層構造をもつエピソードに拡張し,効率良いマイニングアルゴリズムを開発した.項目(c)については,引き続き,各種アルゴリズムを実装し,理論的および実証的な性能評価を行ない,開発にフィードバックする.
|
Research Products
(14 results)