研究概要 |
密度比は2つの確率密度関数の比として定義される.近年,おもに機械学習の分野において密度比の重要性が認識され,密度比を用いた統 計的推論の応用分野が爆発的に拡大している.本研究では,高次元大規模データの解析への応用を念頭に置きつつ,密度比推定のための統計手法を提案し,効率的な計算アルゴリズムを開発することを目指す.加えて,理論的な研究成果をソフトウェア開発へと発展させる.理論から応用分野まで,統計科学の全ての階層に大きなインパクトを与えることを視野に入れている. 本研究の初年度では,密度比推定について主に以下に示すような統計的性質に関する研究を進めることを予定していた.(1)密度比推定の統計的推定精度に関する理論的研究,(2)セミパラメトリック密度比推定,(3)ノンパラメトリック密度比推定. 初年度では,とくに(3)の研究が進んだ.カーネル法を用いた密度比推定について考察し,統計的な性質とアルゴリズムの計算量について次の論文で報告している.T. Kanamori, et al., Computational Complexity of Kernel-Based Density-Ratio Estimation: A Condition Number Analysis. Machine Learning, vol. 90, pp. 431-460,March 2013. これにより,高次元大規模データに対する密度比推定の実際的な応用への道が切り開かれた. また今年度は密度比の推定のみならず,密度の差を直接推定する方法について,研究を進めることができた.密度比と異なり密度差は,安定した推定量を求めることが可能になる.このため,とくに大規模高次元データへの応用に効果があると考えられる.この成果については,当該分野のトップ国際会議において報告されている.
|