研究課題/領域番号 |
24700276
|
研究種目 |
若手研究(B)
|
研究機関 | 大阪大学 |
研究代表者 |
林 賢一 大阪大学, 医学(系)研究科(研究院), 助教 (70617274)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | C統計量 / 生存時間データ / クロスバリデーション / Decision Tree |
研究概要 |
本研究の目標は,生存時間データにおけるDecision Treeの理論的基礎と,その臨床医学への応用である.研究初年度は(1)生存時間データにおけるC統計量の推定量の改善と検証と,(2)Decision Treeに関する理論研究について,最新動向の情報収集と数値実験のための準備をおこなった. (1)生存時間データにおけるC-indexの推定量の改善と検証 応答変数と説明変数の関係を評価することは,適切な統計モデルを構築するための重要な問題である.C-index(C統計量)は,応答が二値変数である場合の受信者操作特性曲線(ROC曲線)の下側面積(AUC)を,応答が生存時間である場合に拡張した量である.C-indexは,統計モデルの診断性能の指標として用いられる.生存時間データは,多くの場合打ち切りを伴って観測されるため,打ち切りを考慮してC-indexの推定を行う必要がある.一般に利用されている生存時間データに対するC-indexの推定量は,生存時間の大小関係が特定できない対を除外する形で構成されるが,打ち切り変数に依存したバイアスが存在する.この問題に対処するために,打ち切り分布で重み付けされた推定量が提案されている.この推定量に対して,クロスバリデーションを用いた改善を行い,数値実験によりその有用性を例証した.この結果は,現在学会発表および論文投稿準備中である. (2)Decision Treeに関する理論研究について Decision Treeについては,従来のAnd条件による分岐だけではなくOr条件による分岐を許容するアルゴリズムや,複数のバイオマーカの組み合わせによる分岐の指標の開発について調査をおこない,それらと本課題に関連する課題を整理した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
生存時間データにおけるC-indexについて,より改善すべき方法を提案することができたため,当初の研究計画から変更はあったものの,学会での発表が決定し,論文を執筆中である.Decision Treeの最新の研究動向と併せても,上記の研究を本課題に応用することができるため,全体として進展は順調であるといえる.
|
今後の研究の推進方策 |
クロスバリデーションを用いた生存時間データに対するC-indexの推定量についての論文を発表する.また,両側打ち切りや区間打ち切りを伴う生存時間データに対しても,よりバイアスの小さい推定量についての理論研究を進める. また,C-indexを用いたSurvival Treeの構築に注力していきたいと考えている.今年度の研究で得られた知見に基づいて,以下の問題について検討する: (i)Survival Treeの頑健化.Decision Treeはデータの少しの変化によって結果が大きく変化することが指摘されている,この問題に対処するために,リサンプリングに基づいた手法の頑健化を目指す. (ii)モデル選択.Survival Treeによって構築された分岐規則の診断・予測可能性を評価するための方法について研究したい.
|
次年度の研究費の使用計画 |
当初予定していた国際学会での発表をおこなわなかったため,今年度の研究費に未使用額が生じたが,25年度に行う予定の研究計画と併せて実施する.また,設備費・消耗品費については,当初予定通りの計画を進めていく.
|