本年度は,(i) Normalized cutの理論的性質に関する研究,(ii) 関数データに適した部分空間クラスタリングに関する研究,(iii) Multiscale bootstrap法によるモデル選択後のselective inferenceに関する研究を行った. 研究(i): 多変量データに対するクラスタリング法としてkernel関数から計算した類似度行列に対するnormalized cut (Ncut)と呼ばれるグラフカット法の理論的性質に関して研究を行った.具体的には,真のdegree関数が既知の場合に,推定量の母集団分布に対する損失がO(1/n)の早いレートで母集団分布に対する損失の最適値に収束することを示した. 研究(ii): 関数データの特徴を上手く活かした部分空間クラスタリング法とその性質に関して研究を行った. 研究(iii): Lassoによる変数選択後の回帰係数の統計的推測に対してTerada and Shimodaira (2017) の枠組みを用いて,モデル選択後の回帰係数に対する selective inference を行う方法を提案した.一般に,multiscale bootstrap法を用いる場合,bootstrapのサンプルサイズを変化させ,bootstrap確率の変化率から幾何的量を推定している.しかし,回帰分析の設定のもとでは,selection eventをデータのサンプルサイズ nに依存しない空間で表現することは困難であり,サンプルサイズに応じてselection eventの形状が変化しまう.そこで,残差をリサンプリングするbootstrapを考え,残差を定数倍することでスケールを変化させ,bootstrap確率の変化率を得る方法を提案した.
|