研究課題/領域番号 |
19H04072
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 早稲田大学 (2023) 横浜市立大学 (2019-2022) |
研究代表者 |
汪 金芳 早稲田大学, 国際学術院, 教授 (10270414)
|
研究分担者 |
田栗 正隆 東京医科大学, 医学部, 主任教授 (20587589)
橋口 陽子 (小野陽子) 横浜市立大学, データサイエンス学部, 准教授 (60339140)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2023年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2022年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2021年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2020年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2019年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
|
キーワード | Real world data / Bayesian Inference / Causal Inference / Cell Regression / Machine Learning / Data-Driven Prior / Real-World-Data / 医療データ / Real World Data / Data Science / Statistics |
研究開始時の研究の概要 |
保全生態学と同様に,データサイエンスはギボンズらが主張するモード2科学に分類されるべき新たな学問である。伝統的データ解析から社会における価値創造への飛躍を目指して,新たなデータ駆動型統計推測パラダイムである「Real-World-Data Inference」を構築することが本研究の目的である。特にデータ駆動型客観的ベイズ法であるReal Bayesian Inferenceや実因果モデル(Real Causal Model)の確立を焦点に当て研究を進める。
|
研究実績の概要 |
これまでの研究を発展させ、特定の性質を持つ部分母集団に属する個体に対して、最適な管理を行うための枠組みの構築を試みました。この枠組みは、ベイズモデルによる統計推論と高い予測性能をもつ機械学習による予測アルゴリズムを組み合わせたもので、近年高血圧の文脈で提案された健康改善フレームワーク(Nakamura, K., et al., 2021)を一般化したものになっています。また提案した枠組みを東京都のある病院が提供した健康診断データに適用し、糖尿病予備軍の個人的健康管理に焦点を当てた包括的な探索研究を行いました。糖尿病の診断に関しては、HbA1cが6.5%を超えると2型糖尿病と診断され、6.0%-6.4% の範囲であれば糖尿病予備軍とされます。また5.9%未満の場合、正常軍と見なされます。糖尿病予備軍の健康状態を管理するために、HbA1cと高い相関を持つリスク因子である体重指数(BMI)と収縮期血圧を選び、これらのリスク因子を逐次的に改善することで、糖尿病予備軍の健康状態の管理に関するシミュレーションを行いました。シミュレーションの結果として、803名の糖尿病予備軍に対して、わずか3.5%が糖尿病予備軍のまま、7%が糖尿病に進行し、89.5%が正常血糖に戻った、という結果が示されました。一方、例えば、スペインにおける研究 (Miquel B., et al., 2020)によれば、糖尿病予備軍で、そのまま放置すれば、41%が糖尿病予備軍のまま、23%が糖尿病に進行し、36%が正常血糖に戻っていました。これらの報告から、今回提案された手法が非常に有効性であることが確認されました。得られた研究成果については、現在複数の投稿論文として纏めている最中です。また、提案手法を広く利用してもらうためにPythonを利用した汎用的なパッケージも開発中で、投稿論文と共に今後公開していく予定です。
|
現在までの達成度 (段落) |
令和5年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和5年度が最終年度であるため、記入しない。
|