2011 Fiscal Year Research-status Report
Project/Area Number |
23740066
|
Research Institution | University of Tsukuba |
Principal Investigator |
矢田 和善 筑波大学, 数理物質系, 助教 (90585803)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 高次元小標本データ / 高次元漸近理論 / 逐次解析 / 判別分析 / マイクロアレイデータ |
Research Abstract |
本研究の土台となる研究目的「高次元小標本(HDLSS)の各種特徴量に対してHDLSS漸近理論と新たな推測理論の構築」に取り組み,高次元小標本特有の幾何学的構造に着目し,HDLSSの統計的推測において, 基礎となる各種特徴量に対して, HDLSS漸近理論と新たな推測理論を与えた. Hall等の先行研究で見つけることができなかった特徴的な2つの幾何学的構造を発見し,高次元小標本データが元来もつこれらの幾何学的構造に基づいて「ノイズ掃き出し法」と呼ばれる新しいPCAを与え,巨大なノイズに埋もれた高次元データ空間から,ノイズを除去して固有空間を有効に推定するための,セミパラメトリックな方法論を与えた.この手法に基づくPCAの各種特徴量に対して,HDLSSの枠組みで一致性を示した.さらに,既存のPCAに比べ,HDLSSの枠組みで大幅な改良となることを,理論的かつ数値的に示した. 一方,高次元小標本の枠組みで平均ベクトルに関して,高次元球面上の与えられたバンド幅の信頼領域や二標本問題,ノルムの信頼区間について,与えた各推定量・統計量の漸近正規性を示し,その漸近的性質に基づき,要求精度を満足するような推定・検定方式を与えた.さらに,高次元共分散行列の推定・検定,高次元判別分析,高次元回帰分析,変数選択問題など,高次元小標本データの統計的推測において推測問題を提示し,それらにオリジナルの理論と方法論を与えた.さらに,DNAデータを用いた実解析例において,提案手法が有効に機能することも確認できた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の基礎となる各種特徴量におけるHDLSS漸近理論を構築し,本研究課題に対する研究の土台を固めることに成功したことが,本研究計画が順調に進展している理由である.
|
Strategy for Future Research Activity |
本研究の土台となる平成23年度の研究結果を踏まえて,より応用を意識した研究目的「HDLSSの判別分析とクラスター分析に関して統計的推測の構築」,「HDLSSにおけるパスウェイ解析と変数選択法の理論的構築」を推進する. 判別分析について,Aoshima and Yata (2011, SA)で構築したHDLSS漸近理論を拡張する.判別超平面に注意して,多群に対する判別手法への拡張も視野に入れ,方法論を構築する.さらに,クラスター分析について,高次元データを分類する上で鍵となるのが,分類にとって有効な空間を如何に探索してデータを射影するかである.射影先のベクトルの選択とその推定が必要になるが,Yata and Aoshima (2010, 2012, JMA)で考案したノイズ掃き出し法とクロスデータ行列法を用いてこれを推定し,HDLSS漸近理論を構築する.パスウェイ解析と変数選択法については,逐次推定論を用いてアプローチする.数回の前処理で有意なパスもしくは変数を大幅に絞り込み,その後に多重検定を行うことで,有意水準と検出力をHDLSSのもとで有効に制御する.また,推定と変数選択を同時に処理する,LASSOによるアプローチも考える.LASSOの最適解をHDLSS漸近理論で求め,その解を利用することで計算コストの削減を考える.
|
Expenditure Plans for the Next FY Research Funding |
残額について,今年度購入予定の消耗品は,3月に納品済みであり,出張についても3月に実施した.どちらも支払いが4月となったために生じたものである. 次年度は,国際学会1回と国内学会4回出席し,研究課題に関する研究発表をおこなう予定である.そのための旅費と学会参加費に研究費を使用する.さらに,それに伴い,プレゼンテーションに使用する小型モバイルパソコンも購入する.一方,最先端の研究を行うために,数理統計学だけでなく医学・工学・生物学などの最新の統計科学関連の研究資料を購入する予定である.また,研究成果を国際的学術雑誌に投稿するため,そのための論文別刷に費用がかかるので,研究費を使用する.
|