研究課題/領域番号 |
22300054
|
研究機関 | 大阪大学 |
研究代表者 |
鷲尾 隆 大阪大学, 産業科学研究所, 教授 (00192815)
|
キーワード | 統計数理 / データマイニング / 高次元データ / 次元の呪い / 確率密度関数 / データ分布 |
研究概要 |
平成23年度は、初年度で実施した(1-1)各次元の呪い現象の洗い出しとそれらの相互関係の整理、類型化、及び(1-2)次元の呪いの根本的な各発生機構の解明と数理的特徴づけ、(2-1)次元の呪いを克服する一般的な統計的推定原理の確立の研究成果を受け、引き続き研究計画の項目である(2)次元の呪い克服原理の探求における(2-1)次元の呪いを克服する一般的な統計的推定原理の更なる確立に取り組むと共に、(2-2)他の次元の呪いを克服する一般的な統計的推定原理の確立にも取り組んだ。 (2-1)次元の呪いを克服する一般的な統計的推定原理の確立 (1-1)及び(1-2)で解明された2つの次元の呪いの発生機構や数理的特徴に基づいて、初年度に明らかにした統計的推定過程を基に、これら次元の呪いを克服する一般的統計的推定原理を検討した。具体的には球面集中現象に起因する統計的推定の性能劣化に対して、分類やクラスタリング性能を改善する最適化手法を検討した。また、確率密度の差異が大きくなることに起因する統計的推定の性能劣化に対して、プロポーザル分布に基づく重み付きデータサンプリング手法を検討した。数値実験を通じこれらの手法によって、高次元データに関する統計的推定や機械学習の精度が大幅に改善することを確認した。 (2-2)他の次元の呪いを克服する一般的な統計的推定原理の確立 (1-1)及び(1-2)で解明された他の次元の呪いの発生機構や数理的特徴に基づいて、これら次元の呪いを克服する一般的統計的推定原理を検討した。具体的には、予測問題において性能を最大化する次元を選択する問題を、劣モジュラ最大化問題として定式化した。そして、それをグローバル最適化する手法を検討した。数値実験を通じて、高次元のデータによる予測問題において、予測性能を最大にする最適な次元組合せを選択可能であることを確認した。 以上により、数千次元以上で高精度、ロバスト、低計算量な統計的推定原理の確立の見通しを得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究計画項目(2-2)他の次元の呪いを克服する一般的な統計的推定原理の確立におおいて、当初、問題をグローバル最適に解くことまでは想定していなかった。しかし、研究の進捗において、最新の離散問題最適化手法を取り入れることで、最大性能の引き出す原理の見通しを得た。
|
今後の研究の推進方策 |
当初研究計画に掲げたように、更に次元の呪いを克服する一般的な統計的推定原理の確立を目指した検討を進める。そして、確立した各統計的推定原理を研究計画項目(3)大規模データマイニング問題へ適用するための(3-1)効率的実装アルゴリズムの開発と(3-2)重要な大規模問題への適用実験を進める。 これによって、本研究で確立した原理の応用検証を行い、現実社会の問題解決への道筋を示す。 これら研究においては、統計数理研究所の連携研究者など他専門分野の研究者との一層緊密な連携を図り、より広範な問題へ対応可能な原理の確立と検証を推進する。
|