2017 Fiscal Year Research-status Report
時系列検診データとゲノム・メタゲノム情報を統合した生活習慣病の重篤化予測の研究
Project/Area Number |
17K12647
|
Research Institution | The University of Tokyo |
Principal Investigator |
長谷川 嵩矩 東京大学, 医科学研究所, 助教 (80753756)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | 統計的時系列解析 / 状態空間モデル / リスク予測 / ゲノムデータ / 腸内細菌叢ゲノム / 健康診断データ |
Outline of Annual Research Achievements |
実施計画書の通り初年度においてはまず,既存のCVDリスク予測手法の日本人への適用とモデルの拡張,知見の蓄積,加えてゲノム・腸内細菌叢メタゲノムデータを用いた生活習慣病のリスク予測手法の開発を行った.心疾患のリスク評価手法は幾つも提案されており,まずはこれらの手法に日本のコホートから得られる検診データを直接適用した.同時に,既存の指標では用いられていないバイタル情報や生活習慣データを用いた場合の,心疾患や重度慢性疾患(高血圧症・糖尿病・慢性腎不全・肝硬変・慢性膵炎)の発症・重篤化に対する予測精度の評価と予測精度の高いモデルの選択を行うことで,今後の解析に用いるべき変数の評価と選定を行った.ここにおいては,Genome Wide Asociation Studyの技法を用いて,個々人が持つ遺伝情報(SNPs)のうちバイタルデータに影響を持つ因子を抽出することや,腸内細菌叢メタゲノムデータからコンポジションのデータを抽出し,解析の変数として用いる準備を行った. 次に,取得されている時系列の健診データを扱うため方法として,状態空間モデルを用いた解析手法の開発に着手した.具体的には,線形の状態空間モデルを検診データに対して適切に適用できるようにモデルの提案を行い,上述した変数を導入し(遺伝的データは取得年度が限られているため,データ数担保の観点から本解析には用いなかった),隠れ変数と外部環境変数の依存関係を推定した.これにより,相関性の高い観測変数を同時に扱い,それらの制御関係を推定することが可能になった他,生活習慣などの外部環境変数がバイタルデータや将来の疾患リスクに与える影響を推定することが可能になった.この研究成果は論文として執筆中であり,学術雑誌に投稿予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の研究計画としては,①既存のCVDリスク予測指標の日本人への適用と説明変数に関する知見の蓄積,②ゲノム・腸内細菌叢メタゲノム情報を統合した生活習慣病のリスク予測手法の開発,を実施する予定であったが,上述した通り,双方に関して予定通り研究計画を進めることが出来た.②に関しては,データ数の問題から一時的にゲノム情報を観測変数として用いない方向で研究成果をまとめているが,新たに2017年度のデータが手に入る予定であるため,共変量としてSNPsや腸内細菌叢のデータを用いることが可能となる.また,次年度に想定していた研究計画である,非線形状態空間モデルへの拡張に関しても,先んじて理論的枠組みの構築を進めており,次年度の早い時期には実装されることが望まれる.このような観点から,進捗状況としては,おおむね順調に進展していると考えて良いと思われる.
|
Strategy for Future Research Activity |
次年度においては,前年度に開発されたモデルを非線形・非ガウス型の状態空間モデルに拡張する.前年度の解析に基づいて,ある健康状態と生活習慣,遺伝子多型情報を持つ個人の重度慢性疾患に関わるバイタルデータ値の将来的な値の予測や生活習慣病の発症を予測する新たなモデルを開発する.状態空間モデルの隠れ変数間の因果関係を推定し,適したモデルを選択するためには,観測データが得られたときの隠れ変数の条件付き確率分布を正確に求める必要が生じる.非線形状態空間モデルまで含む幅広い問題で隠れ変数の状態推定において頻繁に用いられるparticle filterは,隠れ変数とパラメータ数が高次元になると推定精度が著しく低下する「パーティクルの縮退」が知られており,sigma-pointを用いて確率分布を近似するunscented Kalman filterは非線形性が高くなったときの分布の近似精度が低いという問題がある.ここで,近年Kalman filterの理論的拡張の1つとして,3次モーメントまで 設計可能な分布を利用する,closed-skew Kalman filterとunscented Kalman filterを統合・利用した手法を開発する予定である.特に前年度の研究から明らかになったこととして,健康診断データのノイズの形状はガウス型ではなく,例えば食事によって中性脂肪の値が大きく上がるように,片側に裾の重い分布になっていることが挙げられる.これらは3次モーメントの設計が可能な当手法で制御できる問題であり,推定精度の向上が期待される.次年度ではまずこの部分の実装と実験から始め,必要に応じた非線形モデルへの拡張を随時行う予定である.これらの結果も同様に成果をまとめた上で学術雑誌に投稿する予定である.またアプリケーションとして実社会応用が形として提供することも視野にいれている.
|
Research Products
(1 results)