研究概要 |
密度比は2つの確率密度関数の比として定義される量であり,これは2つの確率密度関数の差である密度差と密接に関連している.近年,おもに機械学習や数理統計学の分野において密度比や密度差の重要性が認識されつつあり,応用分野が大きく拡大している.例えば,共変量シフトの下での回帰分析や判別分析,統計的仮説検定,独立成分分析,次元削減などが重要な応用例として挙げられる.本研究では,特に高次元大規模データ解析への応用を念頭に置きつつ,密度比や密度差の推定のための統計手法を提案する.さらに効率的な計算アルゴリズムを開発することを目指す.加えて,理論的な研究成果をソフトウェア開発へと発展させる.以上の研究目標を達成するために,本研究の2年目の計画として,主に以下に示すような研究を予定していた.1.パラメトリック密度比・密度差推定,2.セミパラメトリック密度比・密度差推定,3.密度差推定の統計的性質に対する理論的研究.当該年度において,主に1と3に関する研究で成果を得た.1については,M. Yamada, et al., Relative Density-Ratio Estimation for Robust Distribution Comparison, Neural Computationにおいて発表されている.また3については T. Kanamori and M. Sugiyama, Statistical Analysis of Distance Estimators with Density Differences and Density Ratios. Entropy において論文として公表されている.これらの研究により,密度比と密度差の間の関係について理解が深まり,どのような統計的推論に対してどちらがより有効か,実践的な立場から示唆を与える研究成果の端緒を開くことができた.
|