研究課題/領域番号 |
23K11009
|
研究機関 | 長崎大学 |
研究代表者 |
植木 優夫 長崎大学, 情報データ科学部, 教授 (10515860)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
キーワード | 疾患リスク予測 / 高次元医療データ / ゲノムデータ |
研究実績の概要 |
本研究では、ゲノム、検査値、画像などの多様な高次元医療データを組み合わせて、リスク予測と同時にリスク因子を見出すことのできる高次元変数選択を基礎とした統計手法の開発に取り組み、理論研究およびシミュレーションによる性能評価を行った。閾値化(thresholding)によるスパース回帰手法を中心に研究を行い、理論的な解析によりモデル性能を評価した。ゲノムデータと連続値データといった異なる構造の多様な高次元データへの適用を念頭においてアルゴリズム開発に取り組んだ。並行して、モデルの性能を検証するために、シミュレーションによりデータを生成して手法の性能を検証した。また、LassoやElastic netなどの特徴選択が可能なデータ適応的な回帰手法を仮説検定に組み込むことのできる柳井の一般化決定係数を用いた仮説検定手法についてシミュレーションを用いた比較検証を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では、複数の高次元医療データを組み合わせて、リスク予測と同時にリスク因子を見出すことのできる高次元変数選択を基礎とした統計手法の開発に取り組んだ。理論面での性能評価については、閾値化(thresholding)によるスパース回帰手法を中心に研究を行い、理論的な解析によりモデル性能を評価した。特に、ゲノムデータ(0、1、2の離散値のSNPデータ)および連続値データなど異なる構造の多様な高次元データへの適用を念頭においてアルゴリズム開発に取り組んだ。モデルの作成の際にシミュレーションによりデータを生成して手法の性能検証を行った。また、lassoやElastic netなどの特徴選択が可能なデータ適応的な回帰手法を仮説検定に組み込むことのできる柳井の一般化決定係数を用いた仮説検定手法(Ueki 2021, Comput Stat Data Anal 158, 107168)について、プログラム実装を行い、得られた結果を日本分類学会2023年度シンポジウムで発表した。また、同仮説検定手法にfused lassoを適用し、ゲノムデータを用いたシミュレーションによる比較を行い、論文としてまとめた。
|
今後の研究の推進方策 |
高次元医療データを用いた疾患リスク予測モデルの研究が多数行われているが、例えばゲノムデータのみを用いる予測モデルのように、満足のいく予測精度が得られないケースもしばしば見られる。ゲノムデータを検査値や画像などの高次元医療データと組み合わせることで予測精度を向上させられる可能性があるが、超高次元のデータと異なる種類の高次元データと組み合わせて行う予測モデリングには、方法論的・計算機的な困難がある。今後、引き続き、理論研究とシミュレーションによる検証を行うとともに、実際のデータを用いた検証を加えて、多様な高次元医療データを統一的に扱うリスク予測のための統計手法開発に取り組む。
|
次年度使用額が生じた理由 |
計上していた論文掲載料の使用が次年度へとずれ込むこととなったことと、論文掲載料の高騰を考慮し、一部の予算執行を次年度に延期した。実施予定だった計算機実験およびデータ解析を次年度に実施するため、必要なワークステーションを購入する予定である。
|