2018 Fiscal Year Annual Research Report
半解析リサンプリング法の開発と整備:信頼性評価への統計力学的アプローチ
Project/Area Number |
17H00764
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
樺島 祥介 東京工業大学, 情報理工学院, 教授 (80260652)
|
Co-Investigator(Kenkyū-buntansha) |
小渕 智之 東京工業大学, 情報理工学院, 助教 (40588448)
|
Project Period (FY) |
2017-04-01 – 2022-03-31
|
Keywords | リサンプリング / 交差検証法 / ブートストラップ法 / レプリカ法 / 平均場近似 |
Outline of Annual Research Achievements |
以下の結果を得た. 【課題1】交差検証法:多クラス分類問題に対する効率的な統計モデルである,L1正則化付き多クラス一般化線形モデルに対して,説明変数が独立で同一の分布から生成されていると仮定した場合に精密な評価であることが正当化される,1つ抜き交差検証誤差の半解析的評価法を与えた.またその成果を査読付き論文として公表した.Accelerating Cross-Validation in Multinomial Logistic Regression with L1-Regularization, Tomoyuki Obuchi, Yoshiyuki Kabashima, Journal of Machine Learning Research (2018) 19(52): (1-30) 【課題2】ブートストラップ法:L1正則化付き線形回帰モデルに対して,入出力対に対してリサンプリングを行うpair bootstrapping に関し,説明変数が独立に同一の分布から生成されていると仮定した場合に精密な評価であることが正当化される,推定量のブートストラップ平均/分散に関する半解析的評価法を与えた.現在,その成果をまとめて,査読付き学術誌に投稿中である. 【課題3】stability selection:【課題2】で開発したブートストラップ法に関する半解析的評価法にもとづいて,stability selection により,変数選択を行うための半解析的評価法を開発した.この方法では,ブートストラップによるデータ取得に関する統計的ゆらぎとともに正則化の強さに対するランダムなゆらぎを加えることで,重要変数の選択に関する安定性を評価する.【課題2】で述べた論文に含めて,現在,査読付き学術誌に投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
説明変数が独立で同一の分布から生成されていると仮定した場合について,【課題1】交差検証法,【課題2】ブートストラップ法,【課題3】:stability selection それぞれに対し,所望の統計量に関する半解析的評価法が得られている.これらは当初の計画に沿ったものであり概ね順調に進展していると考えられる.
|
Strategy for Future Research Activity |
これまでは,理論的取扱が比較的容易な,説明変数が独立で同一の分布から生成されていると仮定した場合を中心に半解析的評価法の開発を行ってきた.しかしながら,実際のデータ解析ではこの仮定が妥当とは限らない.今後は,説明変数間に相関が含まれる場合にも対応できる公式の開発にも力を入れる.
|