2012 Fiscal Year Annual Research Report
Project/Area Number |
11J02789
|
Research Institution | Osaka University |
Principal Investigator |
片山 翔太 大阪大学, 基礎工学研究科, 特別研究員(DC1)
|
Keywords | 高次元データ / 高次元漸近理論 / スパース推定 |
Research Abstract |
当該年度,研究代表者は高次元データにおける統計的推測の研究,特に高次元平均ベクトルの推定問題に関する研究を行った.高次元データとは,標本サイズよりも変数の次元が大きなもしくは同程度のデータを指す.前年度までの研究において,実際の高次元データに対して適用可能な平均ベクトルの検定法を提案することに成功したため,当該年度ではその検定問題における帰無仮説が棄却された後の問題を扱った.すなわち,平均ベクトルのどの部分(要素)に有意な差が見られたために帰無仮説が棄却されたのかを検出する方法を提案した,これは多重比較問題と呼ばれるよく知られた問題であり,典型的には各変数ごとに検定を行えば解かれる.しかしながら高次元データにおいては,検定回数が多くなり全体的な有意水準を調整することが非常に難しく,現実的な方法ではない.そこで研究代表者は,検定問題からのアプローチではなく,有意な差をもつ変数を直接推定する方法を与えた.具体的には,平均ベクトルに対する対数尤度にL1ノルムなどの凸制約関数を加えた制約付尤度関数を最適化することによって,有意な差を持つ変数とその値を同時に推定する方法を提案した.実際にこの手法は,平均ベクトルの幾つかの要素を0に推定(スパース推定)することができる方法である.そのため,有意な差のない変数は0と推定され,また,有意な差のある変数の値も同時に推定できる.提案手法は,線形回帰問題においてTibshirani(1996)によって提唱されたLassoと呼ばれる手法を応用したものになっている.しかし,平均ベクトルに対する対数尤度は一般に未知である共分散行列を含んでおり,Lassoを直接応用することはできない.これを回避するため,Cai and Liu(2011)で提案された高次元データにおいて非常に良い性質を持つ共分散行列の推定量を尤度関数の未知部分に代入した.そして,高次元漸近枠組み(標本サイズと変数の次元が共に大きくなる)の下で,サポートの一致性(真に値が0である要素を正確に0と推定できているか)および推定量の平均2乗誤差(MSE)を導出した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の研究計画では,凸制約付尤度関数に基づく平均ベクトルのスパース推定法の提案に留まると予想していたが,「9.研究実績の概要」で述べたようにサポートの一致性を導出することに成功した.これにより,提案手法が単に幾つかの要素を0に推定しているだけでなく,「真に」値が0である要素を正確に推定していることが保障できた.また,推定量の平均2乗誤差(MSE)を導出したことにより,他の関連手法との比較が可能になり,どのような場合に提案手法がMSEの意味で優れているかを考察することが可能になった.以上が評価(1)を付けた理由である.
|
Strategy for Future Research Activity |
今年度までの研究によって,高次元平均ベクトルの検定および推定問題に対してある程度の解法を提案することができた.そこで今後は,平均ベクトルに関する問題を拡張した,多変量線形回帰問題を高次元データにおいて考察する.多変量線形回帰モデルは近年,DNAマイクロアレイデータなどの高次元データ解析の際によく用いられているため,その理論的整備を行うことは重要である.回帰係数行列の検定問題については平均ベクトルの検定問題とほぼ同様であるため,推定問題を考える.平均ベクトルのスパース推定問題において,サポートの一致性を得るためには共分散行列に対してやや強い条件が必要であったため,情報量基準を用いた別のアプローチを主に考察する.
|
Research Products
(7 results)