• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実績報告書

超高次元データに関する統計的推定原理確立と大規模データマイニングへの適用

研究課題

研究課題/領域番号 22300054
研究機関大阪大学

研究代表者

鷲尾 隆  大阪大学, 産業科学研究所, 教授 (00192815)

キーワード統計数理 / データマイニング / 高次元データ / 次元の呪い / 確率密度関数 / データ分布
研究概要

平成23年度は、初年度で実施した(1-1)各次元の呪い現象の洗い出しとそれらの相互関係の整理、類型化、及び(1-2)次元の呪いの根本的な各発生機構の解明と数理的特徴づけ、(2-1)次元の呪いを克服する一般的な統計的推定原理の確立の研究成果を受け、引き続き研究計画の項目である(2)次元の呪い克服原理の探求における(2-1)次元の呪いを克服する一般的な統計的推定原理の更なる確立に取り組むと共に、(2-2)他の次元の呪いを克服する一般的な統計的推定原理の確立にも取り組んだ。
(2-1)次元の呪いを克服する一般的な統計的推定原理の確立
(1-1)及び(1-2)で解明された2つの次元の呪いの発生機構や数理的特徴に基づいて、初年度に明らかにした統計的推定過程を基に、これら次元の呪いを克服する一般的統計的推定原理を検討した。具体的には球面集中現象に起因する統計的推定の性能劣化に対して、分類やクラスタリング性能を改善する最適化手法を検討した。また、確率密度の差異が大きくなることに起因する統計的推定の性能劣化に対して、プロポーザル分布に基づく重み付きデータサンプリング手法を検討した。数値実験を通じこれらの手法によって、高次元データに関する統計的推定や機械学習の精度が大幅に改善することを確認した。
(2-2)他の次元の呪いを克服する一般的な統計的推定原理の確立
(1-1)及び(1-2)で解明された他の次元の呪いの発生機構や数理的特徴に基づいて、これら次元の呪いを克服する一般的統計的推定原理を検討した。具体的には、予測問題において性能を最大化する次元を選択する問題を、劣モジュラ最大化問題として定式化した。そして、それをグローバル最適化する手法を検討した。数値実験を通じて、高次元のデータによる予測問題において、予測性能を最大にする最適な次元組合せを選択可能であることを確認した。
以上により、数千次元以上で高精度、ロバスト、低計算量な統計的推定原理の確立の見通しを得た。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

研究計画項目(2-2)他の次元の呪いを克服する一般的な統計的推定原理の確立におおいて、当初、問題をグローバル最適に解くことまでは想定していなかった。しかし、研究の進捗において、最新の離散問題最適化手法を取り入れることで、最大性能の引き出す原理の見通しを得た。

今後の研究の推進方策

当初研究計画に掲げたように、更に次元の呪いを克服する一般的な統計的推定原理の確立を目指した検討を進める。そして、確立した各統計的推定原理を研究計画項目(3)大規模データマイニング問題へ適用するための(3-1)効率的実装アルゴリズムの開発と(3-2)重要な大規模問題への適用実験を進める。
これによって、本研究で確立した原理の応用検証を行い、現実社会の問題解決への道筋を示す。
これら研究においては、統計数理研究所の連携研究者など他専門分野の研究者との一層緊密な連携を図り、より広範な問題へ対応可能な原理の確立と検証を推進する。

  • 研究成果

    (11件)

すべて 2011

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (8件)

  • [雑誌論文] DirectLiNGAM : A Direct Method for Learning a Linear Non-Gaussian Structural Equation Model2011

    • 著者名/発表者名
      Shohei Shimizu, Takanori Inazumi, Yasuhiro Sogawa, Aapo Hyvarinen, Yoshinobu Kawahara, Takashi Washio, Patrik O.Hoyer, Kenneth Bollen
    • 雑誌名

      Journal of Machine Learning Research

      巻: Vol.12 ページ: 1225-1248

    • 査読あり
  • [雑誌論文] Analyzing relationships among ARMA processes based on non-Gaussianity of external influences2011

    • 著者名/発表者名
      Yoshinobu Kawahara, Shohei Shimizu, Takashi Washio
    • 雑誌名

      Neurocomputing

      巻: Vol.74,No.12-13 ページ: 2212-2221

    • 査読あり
  • [雑誌論文] Estimating Exogenous Variables in Data with More Variables than Observations2011

    • 著者名/発表者名
      Yasuhiro Sogawa, Shohei Shimizu, Teppei Shimamura, Aapo Hyvarinen, Takashi Washio, Seiya Imoto
    • 雑誌名

      Neural Networks

      巻: Vol.24 No.8 ページ: 875-880

    • DOI

      10.1016/j.neunet.2011.05.017

    • 査読あり
  • [学会発表] Prismatic Algorithm for Discrete D.C.Programming Problem2011

    • 著者名/発表者名
      Yoshinobu Kawahara, Takashi Washio
    • 学会等名
      NIPS2011 : Twenty-Fifth Annual Conference on Neural Information Processing Systems
    • 発表場所
      Granada, Spain
    • 年月日
      2011-12-13
  • [学会発表] A New Approach to Bayesian Estimation over the Curse of Dimensionality2011

    • 著者名/発表者名
      Takashi Washio
    • 学会等名
      AI-2011 Thirty-first SGAI International Conference on Artificial Intelligence, Workshop on Machine Learning and Intelligent Autonomous Systems
    • 発表場所
      Chambridge, UK(招待講演)
    • 年月日
      2011-12-12
  • [学会発表] Density Estimation based on Mass2011

    • 著者名/発表者名
      Kai Ming Ting, Takashi Washio, Jonathan Wells, Tony Liu
    • 学会等名
      ICDM2011 : The IEEE International Conference on Data Mining 2011
    • 発表場所
      Vancouver, Canada
    • 年月日
      2011-12-12
  • [学会発表] Analysis of Residence Time in Shopping using RFID Data-An Application of the Kernel density estimation to RFID-2011

    • 著者名/発表者名
      Shinya Miyazaki, Takashi Washio, Katsutoshi Yada
    • 学会等名
      Working note of DMS2011 : Workshop on Data Minig For Service : The IEEE International Conference on Data Mining series (ICDM2011)
    • 発表場所
      Vancouver, Canada
    • 年月日
      2011-12-11
  • [学会発表] Common Substructure Learning of Multiple Graphical Gaussian Models2011

    • 著者名/発表者名
      Satoshi Hara, Takashi Washio
    • 学会等名
      ECML-PKDD2011 : European Conference on Machine Learning and Principle and Practice of Knowledge Discovery in Databases 2011
    • 発表場所
      Athens, Greece
    • 年月日
      2011-09-07
  • [学会発表] Discovering Causal Structures in Binary Exclusive-or Skew Acyclic Models2011

    • 著者名/発表者名
      Takanori Inazumi, Takashi Washio, Shohei Shimizu, Joe Suzuki, Akihiro Yamamoto, Yoshinobu Kawahara
    • 学会等名
      UAI2011 : The 27th Conference on Uncertainty in Artificial Intelligence
    • 発表場所
      Barcelona, Spain
    • 年月日
      2011-07-16
  • [学会発表] A Framework for Shopping Path Research2011

    • 著者名/発表者名
      Katsuyoshi Yada, Takashi Washio, Hiroshi Koga
    • 学会等名
      Workshop on Data Mining Marketing, SIAM : SIAM Conference on Data Mining (SDM11)
    • 発表場所
      Phoenix, USA
    • 年月日
      2011-04-30
  • [学会発表] Application of DNA Sequence Alignment Algorithm to Classification of Shopping Paths through a Supermarket2011

    • 著者名/発表者名
      Kohei Ichikawa, Edward Ip, Katsuyoshi Yada, Takashi Washi
    • 学会等名
      Workshop on Data Mining Marketing, SIAM : SIAM Conference on Data Mining (SDM11)
    • 発表場所
      Phoenix, USA
    • 年月日
      2011-04-30

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi