• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

構造変化マイニング

研究課題

研究課題/領域番号 21300047
研究機関北海道大学

研究代表者

原口 誠  北海道大学, 大学院・情報科研究科, 教授 (40128450)

研究分担者 富田 悦次  電気通信大学, 名誉教授 (40016598)
大久保 好章  北海道大学, 大学院・情報科学研究科, 助教 (40271639)
キーワードクラスタリング / クラスター構造 / 分枝限定法 / クリーク制約
研究概要

年度初頭に示した研究計画で述べた研究項目は下記のAおよびBの2つである.
研究項目A:構造変化マイニングにおいていかなる構造を抽出できるかは,主要なクラスターや概念間の類似性・近接性および非類似性・非近接性の定義にも依存する.一つの有力な定義は,相関・非相関であることには言うまでもないが,研究項目Aにおいては,確率変数間の相関が時間やトピックに応じて,非相関の状態からある程度相関した状態に変化する現象を検出する問題を考えた.相関の尺度としては,データベースのサイズに対して比較的に安定的である,多変数のカルバックライブラー情報量で定め,相関の向上を実現する変数群を枚挙するアルゴリズムを設計・実装・評価した.情報量を用いる理由は,負の相関や,条件付けして初めて検出できる相関(偏相関も含む)も扱えることによる.相関変化に寄与しない変数群を効率的に排除するためのWクリーク制約,冗長な変数を排除し収束を早めるための経験則,などもとりいれたものである.実験結果は,速度,品質ともに良好であり,通常のエマージングパターンやコントラスと法では検出が困難なものを検出できた.成果は既に国際会議に投稿済みである.
研究項目B:これはトッピック毎に作成したデータベース間での変化を検出する.主要な複数のクラスター間の関連性を調べるための基本手法として位置づけている.今年度は,2つのデータベース間に対して実施した.相関尺度としては研究項目Aで用いた情報量を使うことも可能であるが,情報量の計算にはデータ集合の分割を動的に計算・保持する必要性があり,大規模なデータに対してはメモリ効率が一般に悪いことから,自己相関行列から定義されるグラフに対するクラスタリング法を拡張し,相関変化発見にも使える新たな方式を与えた.クラスタリング法に準拠することから,一種の最適化問題の解法を与えることになる.本研究においては,分枝限定法に基づく制約付き最適化問題として定式化したが,相関が変化しない変数の組合せをできうる限り回避する探索が実現されており,よって,相関変化検出器として高速な探索が実現されている.成果の公表状況は,国内学会発表予定,国際会議は投稿論文を執筆中である.

  • 研究成果

    (10件)

すべて 2011 2010

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (7件) 図書 (1件)

  • [雑誌論文] 最大クリーク問題の多項式時間的可解性の一結果2010

    • 著者名/発表者名
      中西裕陽, 富田悦次
    • 雑誌名

      電子情報通信学会論文誌D

      巻: J93-D ページ: 417-425

    • 査読あり
  • [雑誌論文] Finding Rare Patterns with Weak Correlation Constraint2010

    • 著者名/発表者名
      Yoshiaki Okubo, Makoto Haraguchi, Takeshi Nakajima
    • 雑誌名

      Proceedings of the 2010 IEEE International Conferanee on Data Mining Workshops-ICDMW'10

      ページ: 822-829

    • 査読あり
  • [学会発表] 接続概念間の構造制約に基づくレア概念抽出2011

    • 著者名/発表者名
      大久保好章・原口誠
    • 学会等名
      情報処理学会・数理モデル化と問題解決研究会
    • 発表場所
      青島パームビーチホテル(宮崎県宮崎市)
    • 年月日
      2011-03-07
  • [学会発表] Contrasting Correlations by an Efficient Double-Clique Search Method2010

    • 著者名/発表者名
      Aixiang Li, Makoto Haraguchi
    • 学会等名
      The 2nd Asian Conference on Machine Learning ACML'10
    • 発表場所
      東京工業大学(東京都目黒区)
    • 年月日
      2010-11-10
  • [学会発表] Contrasting Correlations Based on Double-Clique Search2010

    • 著者名/発表者名
      Aixiang Li, Makoto Haraguchi
    • 学会等名
      第9回情報科学技術フォーラム・FIT2010
    • 発表場所
      九州大学(福岡県福岡市)
    • 年月日
      2010-09-07
  • [学会発表] PLENARY LECTURE, The Maximum Clique Problem2010

    • 著者名/発表者名
      Etsuji Tomita
    • 学会等名
      The 14th WSEAS International Conference on Computers
    • 発表場所
      Corfu Island, Greece 招待講演
    • 年月日
      2010-07-23
  • [学会発表] Extracting Approximate Biclusters/Patterns from Time Series Medical Data Using Suffix Trees2010

    • 著者名/発表者名
      Muwazi Simona Suzanna, Makoto Haraguchi
    • 学会等名
      人工知能学会全国大会
    • 発表場所
      長崎ブリックホール(長崎県長崎市)
    • 年月日
      2010-06-09
  • [学会発表] 萌芽的概念抽出のための局所分枝限定探索を用いた概念プール掘削法2010

    • 著者名/発表者名
      中島健志・原口誠・大久保好章
    • 学会等名
      人工知能学会全国大会
    • 発表場所
      長崎ブリックホール(長崎県長崎市)
    • 年月日
      2010-06-09
  • [学会発表] 局所分枝限定探索による概念プール更新操作に基づく萌芽的概念のボトムアップ抽出2010

    • 著者名/発表者名
      中島健志・原口誠・大久保好章
    • 学会等名
      情報処理学会・数理モデル化と問題解決研究会
    • 発表場所
      群馬大学(群馬県前橋市)
    • 年月日
      2010-05-21
  • [図書] Biomedical Engineering, Trends in Electronics, Communications and Software2011

    • 著者名/発表者名
      Eteuji Tomita, Tatsuya Akutsu, Tsutomu Matsunaga(Anthony N.Laskovski Ed.分担執筆)
    • 総ページ数
      736
    • 出版者
      IN-TECR

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi