2018 Fiscal Year Annual Research Report
Predicting severity of lifestyle-related diseases by integrating time-series health records with human genome and metagenome data
Project/Area Number |
17K12647
|
Research Institution | The University of Tokyo |
Principal Investigator |
長谷川 嵩矩 東京大学, 医科学研究所, 助教 (80753756)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | 統計的時系列解析 / 状態空間モデル / リスク予測 / ゲノムデータ / 腸内細菌叢ゲノム / 健康診断データ |
Outline of Annual Research Achievements |
本年度においては,前年度に開発されたモデルを非線形・非ガウス型の状態空間モデルに拡張し,これを実データに対して適用した.まず前年度の解析に基づいて,ある健康状態と生活習慣,遺伝子多型情報を持つ個人の重度慢性疾患に関わるバイタルデータ値の将来的な値の予測や生活習慣病の発症を予測する新たなモデルの開発に着手した.ここで状態空間モデルの隠れ変数間の因果関係を推定し,適したモデル選択するためには,観測データが得られたときの隠れ変数の条件付き確率分布を正確に求める必要がある.前年度の研究から明らかになったこととして,健康診断データのノイズの形状はガウス型ではなく,例えば食事によって中性脂肪の値が大きく上がるように,片側に裾の重い分布になっていることが挙げられる.このような特徴的な現象に対処する方法として,近年Kalman filterの理論的拡張の1つとして提案されてている,closed-skew t-distributed Kalman filterを適用した.同モデルを用いることで,前述したようなノイズを適切に表現することが可能になり,このモデルをベースにした提案モデル内の必要な構造・パラメータの推定を可能とする手法の開発も同様に行った.実際に提案手法を時系列の健康診断データに対して適用することで,健康診断時の観測ノイズの影響を吸収しつつ,環境からのバイタル値の影響を明らかにすることが可能であることが明らかになった.本研究結果は現在学術論文として執筆中である.
|