研究実績の概要 |
高次元医用データから有益な情報を効率的に抽出するための統計モデルの開発を目的とした当該研究の3年目である本年度の研究成果を以下にまとめる. 関数データ解析法が高次元データから有益な情報を抽出することに有用であることに注目し, 各被験者の観測に数100万個のボクセルが含まれるsMRIデータのように医用画像データの中でも特に高次元であるデータから疾病を予測したり, 時系列データに基づき疾病と共変量のダイナミクスとの関連性を捉えるためのモデル構築にとりくんできた. このモデルは正則化多変量解析法と基底関数展開の組み合わせで情報量の損失を抑えた次元縮小を可能にするというアイデアから構築したものであるが, 予測の性能を感度特異度の観点から数値実験で検証し, さらに, イベント発生(疾病への罹患)までの時間を予測するための統計モデルの開発にH28年度も引き続き取り組むと同時に, 関数データとして捉えられる共変量の間の相互的関連性をどのようにとらえるかにも注目した. 次元縮小のアイデアは基底関数, 正則化項, モデル選択法それぞれ複数ある手法の組み合わせでどれが最も予測誤差を小さくするか数値実験を工夫した. 成果は論文投稿準備中であるとともに, 国際会議で発表した. また, 脳検診データと身体活動度, 記憶障害, 臨床的評価項目の関連性を分析するためのモデルを健診データへ適用し, 変数間の機序を明らかにした. また、健康長寿社会の実現を目指した全国大規模追跡調査データから有益な情報を抽出し今後の政策に役立てるため, 長期追跡調査データに正則化生存時間解析法を適用し, 予測精度を検討するとともに, 予後因子の特定や因子間の機序を解明するための方法を検討した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
正則化多変量解析法と基底関数展開の組み合わせで情報量の損失を抑えた次元縮小を行う部分から, その後表された共変量の間の関連性をどのように捉えるかに進歩があった. 変数間の構造を知るという当初の研究計画を進めるため, 当該年度は昨年度行った身体活動度, 記憶障害, 臨床的評価項目の関連性を探るため一般的なモデルを用いて実データを解析した事にヒントを得て, 一般的なグラフィカルモデルを臨床データへ適用した. 国際会議での発表と同時に国外の研究者と意見交換ができた.
|