多様な高次元医療データからの疾患リスク予測手法の開発
Project/Area Number |
23K11009
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Nagasaki University |
Principal Investigator |
植木 優夫 長崎大学, 情報データ科学部, 教授 (10515860)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | 疾患リスク予測 / 高次元医療データ / ゲノムデータ / 予測モデル |
Outline of Research at the Start |
本研究では,ゲノム,検査値,画像などの多様な高次元医療データを組み合わせて,リスク予測と同時にリスク因子を見出すことのできる解釈可能性を有する高次元変数選択を基礎とした統計手法の開発に取り組む.
|
Outline of Annual Research Achievements |
本研究では、ゲノム、検査値、画像などの多様な高次元医療データを組み合わせて、リスク予測と同時にリスク因子を見出すことのできる高次元変数選択を基礎とした統計手法の開発に取り組み、理論研究およびシミュレーションによる性能評価を行った。閾値化(thresholding)によるスパース回帰手法を中心に研究を行い、理論的な解析によりモデル性能を評価した。ゲノムデータと連続値データといった異なる構造の多様な高次元データへの適用を念頭においてアルゴリズム開発に取り組んだ。並行して、モデルの性能を検証するために、シミュレーションによりデータを生成して手法の性能を検証した。また、LassoやElastic netなどの特徴選択が可能なデータ適応的な回帰手法を仮説検定に組み込むことのできる柳井の一般化決定係数を用いた仮説検定手法についてシミュレーションを用いた比較検証を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、複数の高次元医療データを組み合わせて、リスク予測と同時にリスク因子を見出すことのできる高次元変数選択を基礎とした統計手法の開発に取り組んだ。理論面での性能評価については、閾値化(thresholding)によるスパース回帰手法を中心に研究を行い、理論的な解析によりモデル性能を評価した。特に、ゲノムデータ(0、1、2の離散値のSNPデータ)および連続値データなど異なる構造の多様な高次元データへの適用を念頭においてアルゴリズム開発に取り組んだ。モデルの作成の際にシミュレーションによりデータを生成して手法の性能検証を行った。また、lassoやElastic netなどの特徴選択が可能なデータ適応的な回帰手法を仮説検定に組み込むことのできる柳井の一般化決定係数を用いた仮説検定手法(Ueki 2021, Comput Stat Data Anal 158, 107168)について、プログラム実装を行い、得られた結果を日本分類学会2023年度シンポジウムで発表した。また、同仮説検定手法にfused lassoを適用し、ゲノムデータを用いたシミュレーションによる比較を行い、論文としてまとめた。
|
Strategy for Future Research Activity |
高次元医療データを用いた疾患リスク予測モデルの研究が多数行われているが、例えばゲノムデータのみを用いる予測モデルのように、満足のいく予測精度が得られないケースもしばしば見られる。ゲノムデータを検査値や画像などの高次元医療データと組み合わせることで予測精度を向上させられる可能性があるが、超高次元のデータと異なる種類の高次元データと組み合わせて行う予測モデリングには、方法論的・計算機的な困難がある。今後、引き続き、理論研究とシミュレーションによる検証を行うとともに、実際のデータを用いた検証を加えて、多様な高次元医療データを統一的に扱うリスク予測のための統計手法開発に取り組む。
|
Report
(1 results)
Research Products
(3 results)