2015 Fiscal Year Research-status Report
スパース正則化法による複雑高次元データ解析法の確立
Project/Area Number |
15K15946
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
片山 翔太 東京工業大学, 社会理工学研究科, 助教 (50742459)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | スパース推定 / ロバスト推定 / 高次元データ |
Outline of Annual Research Achievements |
当該年度は,予定通り外れ値構造を持つ高次元データの解析手法に関する研究を行った.先ず,She and Owen(2011)で提案された,外れ値を含む線形回帰モデルに基づいて,回帰係数パラメータのスパース推定アルゴリズムを作成し,そしてその統計的理論を構築した.一般的には,推定されたパラメータが真のパラメータに近い方がいいが,その近さを評価する際に,確率的誤差および計算機的誤差の両者に基づいて評価を行った.多くの既存研究においては,推定アルゴリズムの出力パラメータと統計的理論を分離して考えているが,これでは実際に得られるパラメータが本当にその統計的理論を満たすか分からない.対して当該年度の研究では出力パラメータを直接的に評価しており,これは統計的にも計算機的にも意義のあるものだと考えられる.なお,この評価によって,変数の次元がサンプルサイズよりも大きな高次元データである場合でも,サンプルサイズがある程度大きければ,出力パラメータは真のパラメータにかなり近くなるということが明らかになった.
また,高次元データ解析においては,パラメータのスパース性を復元できているかどうかも重要となる.特に線形回帰モデルにおいては,スパース性の復元によって選択された変数の妥当性を評価することができる.当該年度の研究では適当な条件のもとで,出力パラメータのサポートが真のサポートに一致するといった,サポートの一致性も証明した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定通り推定アルゴリズムの統計理論を構築することはできたが,推定アルゴリズムの計算量に若干の問題がある.現状,推定アルゴリズムの各ステップにおいてLasso問題を逐次解いており,計算コストが若干大きくなってしまっている.しかしこれはLasso問題を近似的に解くことで解決できると考えている.
|
Strategy for Future Research Activity |
次年度の最初は,現在までの進捗状況で挙げた問題の解決に取り組む.具体的には,Lasso問題を近似的に解くことを考え,それを踏まえて前年度の統計理論を再構築することで解決を目指す.その後,予定通りにグループ構造を持つ高次元データ解析手法の研究を行う.
|
Causes of Carryover |
研究の進捗状況の関係で,当初予定していた国際学会への参加を見送ったため,未使用額が生じた.
|
Expenditure Plan for Carryover Budget |
(1) 高次元データ解析関連の図書を適宜購入する. (2) 香港で開催される国際会議IMS-APRMに参加し,講演および意見交換を行う.また,国内会議にも適宜参加する.さらに,国内の研究者と高次元データ解析に関するディスカッションを適宜行う. (3) 開発した手法を実装し,その有用性を数値実験および実データ解析を通して確認するため,高性能コンピュータおよび周辺機器を購入する.当初考えていたよりも計算コストが大きくなったため,前年度の未使用額をここに合わせて研究を実施する.
|
Research Products
(2 results)