研究課題/領域番号 |
19300040
|
研究機関 | 北海道大学 |
研究代表者 |
原口 誠 北海道大学, 大学院・情報科学研究科, 教授 (40128450)
|
研究分担者 |
富田 悦次 電気通信大学, 電気通信学部, 教授 (40016598)
伊藤 公人 北海道大学, 人獣共通感染症リサーチセンター, 准教授 (60396314)
吉岡 真治 北海道大学, 大学院・情報科学研究科, 准教授 (40290879)
大久保 好章 北海道大学, 大学院・情報科学研究科, 助教 (40271639)
|
キーワード | 情間マイニング / 擬似クラスタ / 時系列データ / 形式概念 / 類似度行列 / スペクトル / トップN法 / クラスタ抽出 |
研究概要 |
本年度は研究計画書における情間マイニングのための双対アルゴリズムについて、2種類のものを与えた。 (1) 離散化時系列データに対するトップN法 特に、時系列データに対する情間マイニングを考慮し、重なりを持つ2つ以上の極大クラスタを、1つの擬似クラスタとして抽出する、トップN法のアルゴリズムを与え、その有効性を検証した。部品となる極大クラスタそのものは、接尾辞木から抽出し、極大クラスタの重なりも、接尾辞木のリンク情報を用いて効率的に抽出できることを確認した。また、検出された擬似クラスタは、同一の時間区間において類似した変動パターンを持ち、かつ、隣接した時間区間において異なる変動パターンを持つことから、時間的挙動の「分岐」現象のうち、顕著なものを抽出できることを確認した。 (2) スペクトルを用いた、形式概念のトップN探索の高速化 探索がより困難となる、頻度が中程度領域でトップN個の形式概念を制約条件のもとで探索する手法について検討を加え、予備的な実験を行った。形式概念束探索においては相関の弱い特徴群よりも強相関の特徴群の方がより大きな外延集合を形成できることから、特徴の相関評価を行う必要がある。今回は、特徴の類似度行列のラプラス行列のスペクトルに基づく、よりスペクトル成分の分散がより小さな特徴を選択する方式を実装・実験し、高速化に寄与できることを確認した。
|