研究概要 |
今年度は主に,密度比の推定の理論とその応用,また最適化理論に関する研究を行った.密度比とは,ふたつの密度関数の比によって表され,共変量シフトのもとでの学習,外れ値検出,特徴抽出,次元削減,独立成分分析,2標本問題など広範に応用されている.密度比は機械学習における基本的方法として確立されつつある.密度比を外れ値検出の問題に応用し,さまざまな工学的応用について考察した結果は,論文"Statistical Outlier Detection Using Direct Density Ratio Estimation"として出版されている.また密度比モデルのもとでの2標本検定について考察した.その研究結果は,"Least-Squares Two-Sample Test","f-divergence estimation and two-sample homogeneity test under semi-parametric density-ratio models"など複数の論文として出版されている.この結果は,密度比モデルのもとでの情報量限界を理論的に示すものであり,重要な進展と考える/さらに本年度は,密度比に関するこれまでの研究成果を,英文書籍としてまとめた.これは"Density Ratio Estimation in Machine Learning"としてCambridge University Pressから出版されている.このように,密度比推定を体系的に論じた書籍は他に例がなく,今後の機械学習,数理統計学の進展にとって重要な貢献となっている.また今年度は,最適化と機械学習・統計学の両分野に深く関わる研究として,グループテストの検定統計量の効率的な計算法について考察した.この成果は,論文"Pooling Design and Bias Correction in DNA Library Screening"として出版されている.さらに,ランダムなノイズが存在する場合の最適化問題についても考察し,統計的学習理論の方法を最適化に応用する研究を行った.この結果,最適解の統計的性質を明らかにした.これは"Worst-Case Violati Qnof Sampled Convex Programs for Optimization with Uncertainty"として出版されている.
|