2015 Fiscal Year Annual Research Report
Development and Application of Statistical Estimation and Simulation for Super High Dimensional Data Space
Project/Area Number |
25240036
|
Research Institution | Osaka University |
Principal Investigator |
鷲尾 隆 大阪大学, 産業科学研究所, 教授 (00192815)
|
Co-Investigator(Kenkyū-buntansha) |
伊庭 幸人 統計数理研究所, モデリング研究系, 教授 (30213200)
Michael E.Houle 国立情報学研究所, 大学共同利用機関等の部局等, 客員教授 (90399270)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 統計的推定 / シミュレーション / 超高次元データ / 次元の呪い / 粒子フィルタ / 機械学習 / データマイニング |
Outline of Annual Research Achievements |
本研究では、データ解析・シナリオ生成シミュレーションを最新の計算幾何学、モンテカルロ計算と融合し、数十万次元の統計的推定とシミュレーション技術への拡張を目指している。また、大規模問題におけるクラスタリング、シミュレーション等、大自由度問題へのこれら拡張技術の適用展開を目途としている。大阪大学の研究代表者の研究室と、研究分担者である国立情報学研究所のM.E.Houle客員教授、同じく研究分担者である統計数理研究所の伊庭幸人教授、研究協力者のオーストラリア・フェデレーション大学のKai Ming Ting教授等の共同研究体制を組んでいる。 研究代表者の研究室は主に超高次元観測データから、データの背後にある対象状態変化のシミュレーションシナリオを推定する粒子フィルタリングの研究開発を担当し、平成26年度に探求したプロポーザル分布を用いる方法の最適化に基づいて、その高精度な推定性能を評価しさらなる改善を行った。 国立情報学研究所M.E.Houle客員教授は、平成26年度に行った超高次元データ空間におけるデータ分布次元の手法拡張を基に、クラスタリングや分類問題に適用する手法を考案した。 統計数理研究所伊庭幸人教授は、平成26年度に拡張した超高次元自由度空間での高効率なシミュレーションシナリオ分布生成手法の理論的裏付けを行った。 オーストラリア・フェデレーション大学のKai Ming Ting教授は、平成26年度に一般化した超高次元データ空間のデータ分布から機械学習技術による推定を高精度化するデータ質量の理論を基に、異常検知や分類問題に対する手法を考案した。 これらの手法は、何れもが本研究が目指す統計的推定とシミュレーション技術確立のための要素技術として必須のものである。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
データ解析・シナリオ生成シミュレーションを最新の計算幾何学、モンテカルロ計算と融合し、数十万次元の統計的推定とシミュレーション技術への拡張を目指し、また大規模問題におけるクラスタリング等の大自由度問題へのこれら拡張技術の適用展開を目途とするという本研究提案の目標に対し、プロポーザル分布を用いる方法の最適化、超高次元自由度空間での高効率なシミュレーションシナリオ分布生成手法の理論的裏付けなど、平成27年度まで達成された研究成果で、概ね当初の目標を達成する見込みだ立ってきている。それらに加えて、超高次元データ空間におけるデータ分布次元の手法拡張を基にしたクラスタリングや分類問題に適用する手法の考案、一般化した超高次元データ空間のデータ分布から機械学習技術による推定を高精度化するデータ質量の理論を基にした異常検知や分類問題に対する手法を考案など、シミュレーションの枠を超えて機械学習問題にまで取り組んだ成果が出始めており、全体として当初想定したシミュレーションやクラスタリング理論・技術に留まらず、異常検知や分類問題などに関する成果が得られつつある。しかも、それらの多くの研究を統計や機械学習の世界的に主要ジャーナルや主要国際会議で発表するに至っている。 さらに、大阪大学の研究代表者の研究室と、研究分担者である国立情報学研究所のM.E.Houle客員教授、同じく研究分担者である統計数理研究所の伊庭幸人教授、研究協力者のオーストラリア・フェデレーション大学のKai Ming Ting教授等の共同研究体制も、極めて順調に機能しており、全体として顕著な成果を創出しつつある。
|
Strategy for Future Research Activity |
データ解析・シナリオ生成シミュレーションを最新の計算幾何学、モンテカルロ計算と融合し、数十万次元の統計的推定とシミュレーション技術への拡張を目指し、また、大規模問題におけるクラスタリング、シミュレーション等、大自由度問題へのこれら拡張技術の適用展開を目指すという当初の本研究提案の目標を堅持しつつ、さらに当初の目標を超えて、超高次元データ空間での異常検知や分類問題に対する理論・手法・技術に関しても探求を行い、より広汎な分野により高度で世界的インパクトをもたらす研究成果の創出を目指していく。 毎年、連携研究者及び研究協力者間で、共同研究会や長期訪問などを行ってきているが、研究テーマに広がりが出てきているため、世界からより多くの研究者が参加可能な国際的なワークショップ研究会、国際会議の場を借りた講演会などの実施も考える。 以上のような研究成果の蓄積と、研究コミュニティーの醸成を通じて、本研究提案に係る理論や手法の研究を、新しい研究分野として確立すべく努力を重ね、国際的な研究ネットワークを構成していく。これによって、本基盤研究の終了後も、継続的に新しい研究分野として継続的な発展が見込める体制を構築する。 平成28年度は本研究提案の成果の最終的創出に関する努力はもちろんであるが、それに加えて上記実現に向けた体制整備にも、努力を払う予定である。
|
Research Products
(11 results)
-
-
-
-
-
-
-
-
-
[Presentation] Estimating Local Intrinsic Dimensionality2015
Author(s)
Laurent Amsaleg, Oussama Chelly, Teddy Furon, Stephane Girard, Michael E. Houle, Ken-ichi Kawarabayashi and Michael Nett
Organizer
KDD2015: the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
Place of Presentation
Sydney, Australia
Year and Date
2015-08-10 – 2015-08-13
Int'l Joint Research
-
-