• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

レート歪み理論に基づく学習とその高度なクラスタ解析への応用に関する研究

研究課題

研究課題/領域番号 20700132
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関群馬大学

研究代表者

安藤 晋  群馬大学, 大学院・工学研究科, 助教 (70401685)

研究期間 (年度) 2008 – 2009
研究課題ステータス 完了 (2009年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2009年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2008年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
キーワード知識発見とデータマイニング / レート歪み理論 / データ圧縮 / クラスタリング / 時系列クラスタリング / 外れ値検出 / 転移学習
研究概要

本課題の成果として,レート歪み理論に基づく正規化学習手法(RD学習)の拡張により,機械学習における先端的かつ実用的な問題への応用手法を開発した.
まず,RD学習を時系列データの主要なモデル(線形回帰モデル・多変量自己回帰モデル)に拡張する定式化を行った.これにより,多項回帰モデルやマルコフモデルで記述される動的システムに対する異常状態の検出手法を実現した.この手法の効果として遺伝子ネットワークで観測される発現時系列を対象として従来手法よりも有意に高い精度・再現率で活性化状態を検出できることを示した.この成果は機械学習・データマイニングの主要国際会議であるKDDにて発表した.
時系列データへの応用に関してはさらにマイクロアレーデータ,金融時系列データ,自律移動ロボット軌跡データ等を整備し,効果的なインスタンスベース異常検出手法を開発している.これは時系列データに内在する多粒度・多視点を同時に考慮した手法であり,データスカッシング・アンサンブル学習等の組み合わせによって効率的なオンラインの異常発見手法を開発した.この成果は国内の研究会にて発表し,データマイニングの主要国際会議に投稿した.
一方,RD学習の理論を分布が独立かつ均一でないデータを翻訳学習問題設定において利用する拡張を行い,教師無し学習に対する翻訳学習の方法論を提案した.主要な成果として,異種情報源から収集した文書集合に対するクラスタリングを実装し,従来手法よりも有意に高い精度や再現率で文書クラスタを発見できることを示した.さらに,RD学習の枠組みの自然な拡張により幾何的な構造を正規化に取り入れる方法論を示した.これを検証するために学術文献データをもとにタイトル・著者・トピックに関するグラフ構造情報を付随したベンチマークを準備し,提案手法ItGAを適用した.ItGAはトピック発見に関して代表的なPLSA,LDAといった従来手法を上回る性能を示したほか,次元縮約法としても文書に関する重要な特徴を抽出できることを示した.これらの成果はデータマイニングの主要国際会議であるICDMで発表し,さらに最新の成果についても主要国際会議に投稿している.

報告書

(3件)
  • 2009 実績報告書   研究成果報告書 ( PDF )
  • 2008 実績報告書
  • 研究成果

    (6件)

すべて 2010 2009 2008

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (3件)

  • [雑誌論文] Detection of unique temporal segments by information theoretic meta-clustering2009

    • 著者名/発表者名
      Shin Ando, Einoshin Suzuki
    • 雑誌名

      Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining

      ページ: 59-68

    • 関連する報告書
      2009 研究成果報告書
    • 査読あり
  • [雑誌論文] Detection of unique temporal segments by information theoretic meta-clustering2009

    • 著者名/発表者名
      安藤晋
    • 雑誌名

      Proceedings of the ACM SIGKDD international conference on Knowledge discovery and data mining 15

      ページ: 59-68

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Unsupervised Cross-domain Learning by Interaction Information Co-dustering2008

    • 著者名/発表者名
      Shin Ando and Einoshin Suzuki
    • 雑誌名

      Proceedings of the 8th IEEE International Conference on Data Mining (ICDM08)

      ページ: 13-12

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [学会発表] 異常クラスタのアンサンブルによる特異行動の検出2010

    • 著者名/発表者名
      星野大祐, Theerasak Tanomphongphang, 安藤晋, 関庸一, Swagat, 鈴木英之進
    • 学会等名
      第78回数理モデル化と問題解決研究会(mps78)
    • 発表場所
      群馬大学荒牧キャンパス情報処理センター
    • 年月日
      2010-05-21
    • 関連する報告書
      2009 研究成果報告書
  • [学会発表] サンプルの所属度に応じた可変自己組織化マップ2010

    • 著者名/発表者名
      多賀谷侑史, 安藤晋, 関庸一
    • 学会等名
      第77回数理モデル化と問題解決研究会(mps77)
    • 発表場所
      伊豆高原ルネッサ赤沢
    • 年月日
      2010-03-05
    • 関連する報告書
      2009 研究成果報告書
  • [学会発表] サンプルの所属度に応じた可変自己組織化マップ2010

    • 著者名/発表者名
      多賀谷侑史
    • 学会等名
      MPS(数理モデル化と問題解決)研究会
    • 発表場所
      伊豆高原 ルネッサ赤沢
    • 年月日
      2010-03-05
    • 関連する報告書
      2009 実績報告書

URL: 

公開日: 2008-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi