本研究ではこれまでに,完全データにおける混合分布のWasserstein距離の評価や,説明変数の数がサンプルサイズよりも大きいような高次元データに対して,理論的・計算量的な観点から有効なアプローチの一つとして知られる貪欲法(greedy algorithm)の研究,さらに正規分布間の距離の尺度であるフレシェ距離に基づく分類問題における補助変数の有用性の研究について取り組んできた. フレシェ距離は二つの母集団分布それぞれの平均ベクトルおよび分散共分散行列を用いて表現されるため,実際の解析ではそれら未知パラメータの推定を行う必要がある.しかしながら,未知パラメータの推定量として単純な不偏推定量を用いた場合,導出したフレシェ距離の推定量の収束レートが高次元データに耐えうるものでは無いという問題点が生じていた.そこで,今年度はこの問題点を解決するために,高次元データに適した未知パラメータの推定量を利用することでフレシェ距離の推定量の収束レートを改良した.この研究内容は国際会議(IMS-APRM2024)で発表している. また,高次元線形回帰モデルにおいて,真のモデルを誤特定している枠組みで,説明変数の従う分布が訓練データとテストデータで異なる共変量シフト下でのorthogonal greedy algorithmについて研究を行い,内容をまとめた論文を執筆中である.この研究内容は,国際会議(2023 ICSDS 及び EcoSta 2023)において,招待講演として発表している.
|