2017 Fiscal Year Annual Research Report
Statistical Analysis of High-Dimensional Data
Project/Area Number |
16H03606
|
Research Institution | Hiroshima University |
Principal Investigator |
山田 宏 広島大学, 社会科学研究科, 教授 (90292078)
|
Co-Investigator(Kenkyū-buntansha) |
早川 和彦 広島大学, 社会科学研究科, 教授 (00508161)
栗田 多喜夫 広島大学, 工学研究科, 教授 (10356941)
柳原 宏和 広島大学, 理学研究科, 教授 (70342615)
若木 宏文 広島大学, 理学研究科, 教授 (90210856)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 高次元データ / 経時データ / 次元削減操作変数法 |
Outline of Annual Research Achievements |
本研究は, 「高次元データの統計分析」という研究課題のもと, 計量経済学の研究者が, 数理統計学・統計的機械学習の研究者と協力して高次元データの分析手法を開発すると同時に, 共同研究を通じて新たな計量経済学研究のシーズを探る。5年間の全研究期間を通して, 次の4項目について重点的に研究を進め研究成果の獲得を目指す: (1) 高次元共分散行列の推定と応用; (2) 経済時系列データ解析手法の開発; (3) 新たな操作変数推定法の開発;(4) 経時データの高次元推測法の開発。このうち, (1)については, 正準相関分析における変数の冗長性検定統計量の分布の大標本・高次元漸近展開公式の計算可能な誤差を得, 学術誌に掲載された。 また, 代表的なMANOVA 検定統計量である, Bartlett-Nanda-Pillai検定統計量の帰無分布の大標本高次元での極限分布による近似公式の計算可能な誤差限界を得た。(2)については, 1次のWhittaker-Henderson smoothingについてサンプルサイズが無限大の場合のスムーザー行列の性質を明らかにするなどしたほか, 計量経済分析への応用を念頭にしてスパース非負値行列分解のアルゴリズムについて調査した。(3)については, 多くの変数を含むファクターモデルの操作変数推定について考察した。具体的には, 2段階最小二乗推定量など14種類の推定量のパフォーマンスをモンテカルロ実験で比較した。(4)については, 目的変数ベクトルの次数が大きい場合での多変量回帰モデルにおける変数選択問題において, どのような非心パラメータ行列, また真のモデルの分布がどのような分布であっても一致性を持つような一般化Cp規準の条件を目的変数ベクトルの次数も無限大としてもよい漸近理論の下で導出した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在までの進捗状況はおおむね順調に進展していると判断できる。その理由を(1) 高次元共分散行列の推定と応用; (2) 経済時系列データ解析手法の開発; (3) 新たな操作変数推定法の開発;(4) 経時データの高次元推測法の開発に分けて記す。(1)について: 統計量の分布の大標本・高次元漸展開近似に関して一定の結果を得たことによる。 (2)について:1次のWhittaker-Henderson smoothingについてサンプルサイズが無限大の場合のスムーザー行列の性質を明らかにするなどしたほか, 計量経済分析への応用を念頭にしてスパース非負値行列分解のアルゴリズムについて調査したことによる。(3)について:数値実験で推定量のパフォーマンスを調べるためのプログラムの作成やその考察も終わっていることによる。 (4)について:本研究課題に取り扱っているGMANOVAモデルの特別な場合として, 多変量線形回帰モデルがある。多変量線形回帰モデルでの統計量の性質を明らかにすることは, GMAMOVAモデルの統計量の性質を明らかにすることに役立つと考えられるため。
|
Strategy for Future Research Activity |
研究期間(5年間)の3年目にあたる平成30年度は,次の4項目について重点的に研究を進め将来の研究成果の獲得を目指す: (1) 経時データの高次元推測法の開発:(a) 生存時間データ解析において,ベースラインハザードが未知の定数であるような比例ハザードモデルは,指数分布を核とした一般化線形モデルとなる。個体がクラスターに分かれ,クラスター内の相関を与える,ランダム効果を加えたモデルに関する推測法に,ラプラス近似を応用することを検討する。 (b) 目的変数ベクトルの次数と説明変数の個数が大きい場合での多変量回帰モデルにおける変数選択問題において,目的変数の次元数と説明変数の個数を標本数で割ったものが1未満の値に収束する条件の下で標本数を無限大とする漸近理論の下で真のモデルの分布が正規分布でなくても一致性を持つような情報量規準を提案する。(2) 経済時系列データ解析:(a) 経済時系列のトレンド推定法の開発に取り組む。特に,次元が大きなスムーザー行列の計算に関する新たな知見の獲得を目指す。 (b) 非負値行列因子分解法を経済データ解析に応用して新たな知見の獲得を目指す。具体的には,パラメトリックモデルの導入やスパース制約の導入について検討する。(3) 新たな操作変数推定法の開発:高次元共分散構造分析における推定と尤度比検定について考察する。具体的には,共分散行列の次元が大きいときの最尤推定量や尤度比検定の振る舞いを数値実験で調べ,余裕があれば理論的に考察を行う。ただし,一般的なモデルでは,理論的考察が難しいため,具体的なモデルを考え,先行研究との関連性を考察する。
|