研究課題/領域番号 |
19H04072
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 早稲田大学 (2023) 横浜市立大学 (2019-2022) |
研究代表者 |
汪 金芳 早稲田大学, 国際学術院, 教授 (10270414)
|
研究分担者 |
田栗 正隆 東京医科大学, 医学部, 主任教授 (20587589)
橋口 陽子 (小野陽子) 横浜市立大学, データサイエンス学部, 准教授 (60339140)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2023年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2022年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2021年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2020年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2019年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
|
キーワード | Bayesian inference / Real-World-Data / Cell Regression / Data-Driven Prior / Machine Learning / Diabetes / Real world data / Bayesian Inference / Causal Inference / 医療データ / Real World Data / Data Science / Statistics |
研究開始時の研究の概要 |
保全生態学と同様に,データサイエンスはギボンズらが主張するモード2科学に分類されるべき新たな学問である。伝統的データ解析から社会における価値創造への飛躍を目指して,新たなデータ駆動型統計推測パラダイムである「Real-World-Data Inference」を構築することが本研究の目的である。特にデータ駆動型客観的ベイズ法であるReal Bayesian Inferenceや実因果モデル(Real Causal Model)の確立を焦点に当て研究を進める。
|
研究成果の概要 |
本研究では、リアルワールドデータを活用した高度な統計解析および機械学習手法を開発しました。特に健康科学や医療分野において様々な実証研究を行い、提案手法の有効性を確認しました。具体的には、異なるデータソースを統合してベイズ回帰モデルを用いた精密な統計解析法、深層学習を用いたCovid-19陽性者数の予測モデル、およびXGBoostを用いた血糖値予測モデルを構築しました。また、個人の健康状態を向上させるための管理方法を提案し、その有効性をシミュレーションおよび実証研究を通じて確認しました。研究成果は、論文や、著書、学会発表に纏め、また広く使用されることを前提とする計算機プログラムも公開予定です。
|
研究成果の学術的意義や社会的意義 |
本研究は、リアルワールドデータを活用して高度な統計解析および機械学習手法を開発し、データサイエンスにおける新たな理論の提唱と、健康科学や医療分野の発展に貢献を果たしました。学術的には、異なる形式のデータを統合する手法の提案や、統計的推論と機械学習を組み合わせた個別管理のための新たな理論的枠組みを提示しました。これにより、膨大で多様なリアルワールドデータの効果的な活用方法を提供し、また極めて社会的意義の大きい個人の健康管理や疾患予防における実践的なアプローチをもたらす可能性を示しました。
|