2008 Fiscal Year Annual Research Report
高次元小標本におけるデータ解析の数理統計学的基礎とその応用
Project/Area Number |
18300092
|
Research Institution | University of Tsukuba |
Principal Investigator |
青嶋 誠 University of Tsukuba, 大学院・数理物質科学研究科, 教授 (90246679)
|
Co-Investigator(Kenkyū-buntansha) |
赤平 昌文 筑波大学, 大学院・数理物質科学研究科, 教授 (70017424)
小池 健一 筑波大学, 大学院・数理物質科学研究科, 准教授 (90260471)
大谷内 奈穂 筑波大学, 大学院・数理物質科学研究科, 助教 (40375374)
|
Keywords | 統計科学 / 多変量解析 / 機械学習 / 生体生命情報学 / マイクロアレイ / 高次元データ / 主成分分析 / 固有値問題 |
Research Abstract |
本年度は、高次元データ空間に内在する固有空問を小標本で推定するための、次元縮小の方法論を研究した。この推定問題は近年注目を集め、米国の研究機関を中心に多数発表されているが、理論構築に正規性か類する仮定を必要とし、現実のデータ構造からは大きく乖離している。青嶋は、非正規のもと、固有空問の推定に数理統計学による証明を与え、固有値と固有ベクトルの推定が一致性を有するモデルの分類を詳細に行った。この証明には、昨年度までの本研究課題における高次元漸近理論の開発が大きく寄与している。固有値と固有ベクトルの推定が一致性を有しないモデルであっても、標本数が次元に関するあるオーダー条件を満たせば、推定が一致性もつことも証明した。これらの結果は、多くの先行研究で報告されていた、高次元小標本における主成分分析の不具合を解消するものになっており、主成分スコアの推定にも、高精度のパフォーマンスを示した。一般化固有値問題に帰着する他の分析への応用も考えられ、それ特有の射影法の開発と、高次元小標本における情報量規準の再考が必要になる。赤平は、正則条件が必ずしも成り立たない非正則推定に焦点を当て、情報量の概念とその役割を研究し、いくつかの情報量等を導入して、それらの相互関係に基づいて推定量の一致性、漸近効率等を考察した。小池は、非正則推定の逐次決定方式を考案し、点推定と区問推定の両面から考察した。大谷内は損失関数の性質に注目し、線形指数損失関数とある事前分布に関するベイズリスクを考察した。本研究課題で得られた成果は、国内外の学会、研究集会で多数の発表を行った。12月には、筑波大学にて、研究課題に関するシンポジウムを開催して、理論と応用の双方の研究者との意見交換の場にすることができた。
|