研究実績の概要 |
高次元医用データから有益な情報を効率的に抽出するための統計モデルの開発を目的とした当該研究の2年目である本年度の研究成果を以下にまとめる. 関数データ解析法が高次元データの解析に有用であることに注目し, 昨年度は, 例えば各被験者の観測に数100万個のボクセルが含まれるsMRIデータのように医用画像データの中でも特に高次元であるデータから疾病を予測するための判別モデルを構築した.このモデルはスパース性を仮定し, 正則化多変量解析法と基底関数展開の組み合わせで情報量の損失を抑えた次元縮小を可能にするというアイデアから構築したものであるが, 今年度はその予測の性能を, 感度特異度の観点から数値実験で検証した.さらに, イベント発生(疾病への罹患)までの時間を予測するための統計モデルの開発に取り組んだ.次元縮小のアイデアは判別モデルと同様のものであり, ここでは, 基底関数, 正則化項, モデル選択法それぞれ複数ある手法の組み合わせでどれが最も予測誤差を小さくするか, 数値実験を行い検証した. 成果は論文投稿準備中であるとともに, 国際会議で発表した. また, 脳検診データと身体活動度, 記憶障害, 臨床的評価項目の関連性を分析するためのモデルを健診データへ適用し, 変数間の機序を明らかにした. さらに, 健康長寿社会の実現を目指した全国大規模追跡調査データから有益な情報を抽出し今後の政策に役立てるため, パイロットスタディとして10年間の追跡調査の一部のデータにスパース性を仮定した生存時間解析法を適用し, 予測精度を検討するとともに, 予後因子の特定に取り組んだ.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
提案したモデルはスパース性を仮定し, 正則化多変量解析法と基底関数展開の組み合わせで情報量の損失を抑えた次元縮小を行うが、数値実験によりその予測性能を検証している. また、変数間の構造を知るという当初の研究計画を進めるため、当該年度はまず脳MRIデータと身体活動度, 記憶障害, 臨床的評価項目の関連性を探るため一般的なモデルを用いて実データを解析した. 国際会議での発表と同時に国外の研究者と意見交換ができ、さらに論文投稿のための数値実験の追加を行った.
|