2012 Fiscal Year Annual Research Report
超高次元データに関する統計的推定原理確立と大規模データマイニングへの適用
Project/Area Number |
22300054
|
Research Institution | Osaka University |
Principal Investigator |
鷲尾 隆 大阪大学, 産業科学研究所, 教授 (00192815)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | データマイニング / 統計的推定 / 高次元データ / 次元の呪い / 粒子フィルタ |
Research Abstract |
高次元事例ベクトルXiの下でのある情報Yの確からしさp(Y|Xi)から、ベイズ推定によってYの下でのXの期待値EY(X)を推定する場合に、次元の呪いを軽減する方法としてプロポーザル分布を用いるIEP(intensive and extensive proposal)手法を提案した。この手法では実データから大まかに予想されるベイス推定分布p(X|Y)の中心付近と裾野に人工データを付加して、実データの球面集中現象とスパース化現象を緩和した新たなプロポーザル分布q(X)に従うデータを生成する。ただし、新たなデータに元データ分布を反映させるため、新たなデータの各事例をw(Xi)=p(Xi)/q(XI)によって重み付ける。これにより、Yの下での事例Xiの確率をp(Xi|Y)=w(Xi)p(Y|Xi)/Σw(Xi)p(Y|Xi)によって重み付き推定し、それを基にEY(X)= ΣXip(Xi|Y)を得る。IEP手法を粒子フィルタに適用することで、本質次元が非常に高いカオスダイナミクスを有する系の観測ベクトルYの系列から、系の高次元状態ベクトル を高精度にベイス推定する。 本提案手法を、東太平洋の巨視的な海洋波動に関する人工衛星リモートセンシング時系列データを対象として、波高の高精度予測推定を行った。これは海面の2次元的広がりを持つセンシングデータであり、観測ベクトルY(t)は200次元、波動の状態ベクトルは400次元である。2次元の広がりを持つ海洋波動は、システム方程式としてKadomtsev-Petviashvili equationに従うことが知られている。これに標準的PFと上記IEPを適用したマージナル推定値の精度を比較した結果、計算時間にはそれほど大きな違いをもたらさずに、提案手法が高次元データに対して標準的PFよりも遥かに高い精度を達成することを示した。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(13 results)
-
-
-
-
-
-
-
-
[Presentation] 重み付き最尤推定に基づく方策探索法2012
Author(s)
植野 剛, 林 浩平, 鷲尾 隆, 河原吉伸
Organizer
第15回情報論的学習理論ワークショップ(IBIS2012)予原稿集, 電子情報通信学会技術研究報告, Vol.112, No.279, pp.165-170
Place of Presentation
東京都文京区
Year and Date
20121107-20121107
-
-
-
-
-