2020 Fiscal Year Research-status Report
長期健診受診者の欠損値の多重代入データに基づく疾病罹患リスク予測と予防方法の確立
Project/Area Number |
19K11746
|
Research Institution | University of Shizuoka |
Principal Investigator |
栗木 清典 静岡県立大学, 食品栄養科学部, 教授 (20543705)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 生活習慣病 / 罹患リスク / 予測モデル / 時系列データ / 欠測値 / 多重代入法 |
Outline of Annual Research Achievements |
肥満、高血圧、脂質異常症、糖尿病、および、メタボリックシンドロームの罹患までの時間と生活習慣要因との関連を検討する長期間の時系列データは、各種疾患の罹患予測モデルの作成に有用である。しかし、長期間の時系列データに欠損値が多いという問題は、 (i) 欠損値の有る者『非継続受診者』を除外して各種疾患の罹患予測モデルを作成する場合、対象者の選択バイアスが、(ii) 欠損値に対象集団の平均値を代入して各種疾患の罹患予測モデルを作成する場合、各種疾患の罹患予測の精度が過小もしくは過大な評価となる。 そこで、本研究は、J-MICC研究の静岡・桜ヶ丘地区の独自研究として、約6,400人のベースライン時から過去5年間、および、現在までの5年間の計10年間の健診データを、個人レベルでデータを突合してデータベース化した。この大規模な長期の時系列データより、各種疾患の罹患予測モデルを作成するため、『非継続受診者』の欠損値をマルコフ連鎖 (1個前の状態によって次の状態が決まる連鎖) とモンテカルロ法 (乱数を発生させること) を組み合わせた “multiple imputation by Markov Chain Monte Carlo methods (MCMC法)” 法による多重代入法により『継続受診者と非継続受診者で構成される疑似完全データ』で解析できる統計手法を修得した。なお、当初の研究計画にない新たな統計手法も修得した。 さらに、各種疾患の罹患予測モデルの精度を高めるため、例えば、適正血圧値の維持管理の高精度モデルを確立するため、尿試料中Na+やK+などを測定、また、肥満では、第2のヒトゲノムである腸内細菌叢の解析をしている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
これまでに、本研究は、J-MICC研究の静岡・桜ヶ丘地区の独自研究として、5つの健診機関 (研究協力機関) より、約6,400人のベースライン時から過去5年間、および、現在までの5年間の計10年間の健診データを毎年提供いただいている。それらの健診データを個人レベルで突合してデータベース化した。生活習慣要因の改善や精神ストレスの低減による疾患別の一次予防法を提言するため、食事、飲酒、喫煙、運動・身体活動などの生活習慣要因や精神ストレス等は、5年後調査の質問票で入手した (ベースラインデータは、研究の開始前に入力済み)。回答の得られないベースライン調査の参加者には、簡易版の質問票にて郵送調査を行った。現在、入力したデータの最終確認を行っており、健診データとの突合に時間を要している。 適正血圧値の維持管理するモデルでは、そのモデルの精度を高めるため、ベースライン時、および、5年後調査で収集した尿試料のNa+やK+などの電解質を測定しており、もう少しの測定で終える予定でいる。肥満予防の精度を高めるため、また、保健・栄養指導に適用できる生体バイオマーカーを開発するため、5年後調査で収集した便試料より次世代シークエンサーで腸内細菌叢を解析した。年齢、性別などの交絡因子を最小限にするマッチング法でコーホート内症例・対照研究の測定対象者 (肥満の症例群と対照群) を増やして解析している。 この大規模な長期の時系列データより、各種疾患の罹患予測モデルを作成するため、欠損値をMCMC法で多重代入法により『継続受診者と非継続受診者で構成される疑似完全データ』で解析できる複数の統計手法 (当初の計画に無い方法を含む) を修得した。
|
Strategy for Future Research Activity |
最終年では、J-MICC研究の静岡・桜ヶ丘地区における約6,400人の計10年間の健診データより、『非継続受診者』の欠損値をMCMC法によるmultiple imputationで補完して解析し、肥満、高血圧、脂質異常症、糖尿病、メタボリックシンドロームの罹患リスクの予測モデルを高精度に確立する。適正血圧値の維持管理については、尿試料中Na+やK+などを測定して高精度モデルを確立する。肥満予防、適正体重の維持管理については、腸内細菌叢を解析して高精度モデルを確立する。各種疾患の罹患予測モデルの精度は、欠損値の発生メカニズムが完全なランダムか否かによる影響を受けるため、欠損値のMCMC法による多重代入法による補完の不確実さについて感度分析を行う。 各種疾患の罹患予測モデルの確立とともに、食事、飲酒、喫煙、運動・身体活動などの生活習慣要因や精神ストレス等との関連を明らかにする。次いで、生活習慣要因の改善や精神ストレスの低減による疾患別の一次予防法を提言する。 さらに、『継続受診者』と『非継続受診者』の人口学的特性、各健診項目、生活習慣要因、精神ストレスなどを比較して、継続受診、および、メタボリックシンドロームや高血圧などの一次予防や血圧維持のための食事・保健指導方法を確立する。 そして、最近のゲノム医療の進展を考慮し、ゲノム情報を考慮した検討も必要である。 各種疾患の罹患リスク予測モデルにおいて、小規模なgenome wide association study (GWAS) データによる一塩基多型など検討から、将来の大規模なGWAS解析に向けた基礎資料を作成する。
|
Research Products
(4 results)