研究課題/領域番号 |
17H00764
|
研究機関 | 東京工業大学 |
研究代表者 |
樺島 祥介 東京工業大学, 情報理工学院, 教授 (80260652)
|
研究分担者 |
小渕 智之 東京工業大学, 情報理工学院, 助教 (40588448)
|
研究期間 (年度) |
2017-04-01 – 2022-03-31
|
キーワード | リサンプリング / 交差検証法 / ブートストラップ法 / レプリカ法 / 平均場近似 |
研究実績の概要 |
以下の結果を得た. 【課題1】交差検証法:多クラス分類問題に対する効率的な統計モデルである,L1正則化付き多クラス一般化線形モデルに対して,説明変数が独立で同一の分布から生成されていると仮定した場合に精密な評価であることが正当化される,1つ抜き交差検証誤差の半解析的評価法を与えた.またその成果を査読付き論文として公表した.Accelerating Cross-Validation in Multinomial Logistic Regression with L1-Regularization, Tomoyuki Obuchi, Yoshiyuki Kabashima, Journal of Machine Learning Research (2018) 19(52): (1-30) 【課題2】ブートストラップ法:L1正則化付き線形回帰モデルに対して,入出力対に対してリサンプリングを行うpair bootstrapping に関し,説明変数が独立に同一の分布から生成されていると仮定した場合に精密な評価であることが正当化される,推定量のブートストラップ平均/分散に関する半解析的評価法を与えた.現在,その成果をまとめて,査読付き学術誌に投稿中である. 【課題3】stability selection:【課題2】で開発したブートストラップ法に関する半解析的評価法にもとづいて,stability selection により,変数選択を行うための半解析的評価法を開発した.この方法では,ブートストラップによるデータ取得に関する統計的ゆらぎとともに正則化の強さに対するランダムなゆらぎを加えることで,重要変数の選択に関する安定性を評価する.【課題2】で述べた論文に含めて,現在,査読付き学術誌に投稿中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
説明変数が独立で同一の分布から生成されていると仮定した場合について,【課題1】交差検証法,【課題2】ブートストラップ法,【課題3】:stability selection それぞれに対し,所望の統計量に関する半解析的評価法が得られている.これらは当初の計画に沿ったものであり概ね順調に進展していると考えられる.
|
今後の研究の推進方策 |
これまでは,理論的取扱が比較的容易な,説明変数が独立で同一の分布から生成されていると仮定した場合を中心に半解析的評価法の開発を行ってきた.しかしながら,実際のデータ解析ではこの仮定が妥当とは限らない.今後は,説明変数間に相関が含まれる場合にも対応できる公式の開発にも力を入れる.
|