研究概要 |
測定技術の近年の急速な進化に伴い複雑多様化する医学・生物学データから、医学研究の発展に役立つ知見を有効に抽出するための統計学的手法の開発と実装を行った。特に、各個体の観測数が多く高次元となるデータを解析するための統計学的モデリングには、関数データ解析のアプローチを用いた。 高次元データの平滑化を行う際に必要となる基底展開法では、正則化法に基づき最適な基底展開モデルを選択するが、情報量規準に基づくモデル選択が有効であることがわかっている(Konishi and Kitagawa 2008, Araki et al. 2009)。 一方で、この選択の際には数多くの全てのモデル候補に対して規準値を計算する必要があるため計算の負荷が大きく、また候補の中に真が含まれている保証はなかった。 そこで、最適化問題の解法を工夫することで情報量規準により効率的にモデル選択を実行する方法を提案し、提案した手法は個体差の調整を行いながら、実際の胃がんデータへ適用しその有用性を示した(Araki and Hattori 2013)。 また、医学データの中でも特に高次元であるのが脳MRIデータである。各個体の脳全体を掌握するためのデータは約100万次元となり、通常の統計手法では解析が不可能であった。本研究では、高次元データに基づく判別モデルを関数データ解析手法を元に構築した。提案手法により、高次元データの次元縮小に加え、観測誤差を取り除くことができた。また、医学データの解析に重要である個体差(年齢、体重、病歴など)の調整を、説明変数に共変量を取り込むことができる判別モデルを構築することで可能とした。このモデルの適用により3次元脳画像データからアルツハイマー病を早期発見し、さらに早期発見に関連の深い脳部位を特定することが可能となった(Araki et al. 2013)。
|