研究概要 |
1.当該年度は,近年の著しい科学技術の発達と共に多様化した最先端の医学データの中でも特に,時間や空間における観測がある高次元な医学データ(例えば繰り返し測定や磁気共鳴が像データなど)から治療に役立つ情報を有効に引き出すための解析法について,精確に有用な情報を引き出すための統計学的モデルの構築を行った. 2.まず,患者背景に加えて時間や空間の変化に伴い変動するデータ(例えば脳画像データ)から,疾病群と健常群を判別するための判別モデルの構築を行った.ここで,通常画像データは非常に高次元であり,一方で標本数は限られているため,高次元低標本問題がおこり,新たな統計モデルが必要とされる.そこで,非線形ロジスティックモデルによる判別を提案した.この判別モデルにより,2値や連続値の共変量と画像データなど様々なタイプの説明変数をモデルに組み込む事ができた. 3.提案モデルでは,超高次元の未知パラメータを基底展開法により次元縮小した.また,疾病に関連の強い画像中の部分を特定するため,変数選択を考えた.通常の変数選択法では,係数の有意性の検定や,AICやBICなどの情報量規準を用いて変数選択を行うが,画像データのように100万も次元がある場合には検証するべき係数の個数やモデルの数が莫大になり,全ての候補の組を検討するのは実質上不可能となる. 4.そこで,変数選択とパラメータ推定が同時に行える事で近年注目されているスパース正則化法をパラメータ推定に用いる事で,パラメータ推定の安定性を確保し,さらに疾病に関連の強い画像中の部分を特定することができた.手案手法はアルツハイマー病早期発見のための脳MRI画像データへ適用し,誤判別率やAUCを調べる事で,判別精度のよい手法が提案できた事がわかった。
|
今後の研究の推進方策 |
当該年度に提案した統計について,基底展開とスパース正則化の関連性について研究する. また,疾病に関連の強い変数の特定のための手法としてスパース正則化による特異値分解が考えられるが,提案したスパース正則化非線形ロジスティック判別法にこの分解法を取り入れ,基底展開との関連性を調べる.また,現在用いている動径Bスプライン基底と他の基底関数を比較し,どの程度結果に影響するのかを数値実験により調査する.この研究結果は学会で発表すると共に国際ジャーナルへ投稿する.
|