2021 Fiscal Year Research-status Report
生存時間と打ち切り時間の依存性を考慮した解析法の構築
Project/Area Number |
20K19762
|
Research Institution | Tokyo University of Science |
Principal Investigator |
下川 朝有 東京理科大学, 理学部第二部数学科, 講師 (80756297)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 生存時間解析 / 依存性打ち切り / 木構造 / ランダムフォレスト |
Outline of Annual Research Achievements |
本研究では,生存時間と打ち切り時間の依存性を考慮したモデル構築法の確立とその有意性の検証を目的としている.生存時間を扱う解析の多くは,生存時間と打ち切り時間の独立性を仮定するが,この仮定が現実のデータにおいて成り立つかは疑わしい場合が多く存在する.そのような場合に対処可能な手法について検討するため,本研究では具体的に,「コピュラ関数に含まれる変数間の依存度合いを表すパラメータの統計的推測法」,「コピュラ関数を用いたノンパラメトリックなモデル構築法」,そして「変数間の依存を考慮した共変量を含むモデルの構築法」の確立を目標としている. 対象年度では,昨年度得られた結果を発展させ,生存時間と打ち切り時間にワイブル分布を,依存性をモデル化するためにClaytonコピュラ及びFrankコピュラを仮定したもとで,推定量の従う分布について検討を行った.この研究により,より一般化された条件のもとで,生存時間に関する統計的推測を行うための手法を提案することができた.生存時間データの解析は,医学研究をはじめとする様々な分野において広く必要とされており,本研究で得られた結果は今後そのような分野において役立つものであると期待される. 加えて,上記で得られた結果を応用し,共変量を含むデータの解析のために,木構造に基づくモデルへと拡張した.決定木によるモデル化は医学研究において広く用いられており,本研究で得られた結果は大いに役立つと考えられる.また,木構造は機械学習の一手法としても高い人気を持ち,特にランダムフォレストは現在の機械学習における主流の1つであるアンサンブル学習の代表的な手法となっている.そのため今回得られた結果は,現在様々な分野で活用されている機械学習分野においても役立つものと期待される.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
対象年度における研究目的の1つは,「コピュラ関数に含まれる変数間の依存度合いを表すパラメータの統計的推測法についての検討」について,昨年度得られた結果を発展させることにあった.この目的のために,生存時間と打ち切り時間にワイブル分布,また依存性をモデル化するためにClaytonコピュラ及びFrankコピュラを仮定したもとで,推定量の従う分布について引き続き検討を行った.より具体的には,中心極限定理に基づく理論構築を行い,その性質について理論的な考察,シミュレーションによる有限標本化での振る舞いの検討,及び実データ解析を通して得られる結果の解釈について調べた.加えて,ブートストラップ法を用いた信頼区間の構築,及び検定についても考察し,シミュレーションによる比較検討も行った. またもう1つの研究目的は「変数間の依存を考慮した共変量を含むモデルの構築法についての検討」について,やはり昨年度に引き続き研究を発展させることであった.この目的のため,上記で得られた結果を適用した木構造に基づく手法について検討を行い,昨年度の研究で課題となった,コピュラに含まれるパラメータの収束が非常に遅いため,木構造内に含まれるそのパラメータに対する適切な制限を与える方法について検討した.幾つかの制限について考察したが,シミュレーションを通した比較から,生存木の作成における適切な制限を与えることは難しく,予測精度を保つことは難しいことが分かり,当初予定していた通りの成果は得られなかった.一方でランダムフォレストにおいては,制限を与えたとしてもその精度をより高く保てることが分かった.
|
Strategy for Future Research Activity |
次年度では主に,「変数間の依存を考慮した共変量を含むモデルの構築法」について本年度までに得られた結果を発展させることと,「コピュラ関数を用いたノンパラメトリックなモデル構築法」について検討していく. 本年度までに得られた結果から,生存木構築において依存性打ち切りを考慮した場合,コピュラに含まれるパラメータの収束は非常に遅いこと,パラメータに対する制限を与えると,精度を保つことが難しいことが分かっている.そこでまずはランダムフォレストの作成に注目し,どのような制限の下でモデルを構築すれば,高い精度が得られるのかについて主にシミュレーションを通して検討していく.現在のところ,制限自体をランダム化する手法が有効であると考えているが,他の方法と比較検討しながら進めていく.また生存木の作成については,コピュラ関数を用いたノンパラメトリックなモデル構築法で得られた結果を適宜利用しながら,新たな手法について検討していく. 続いて,生存時間及び打ち切り時間を表す確率変数が従う分布のパラメトリックな仮定を緩めるため,反復法を用いたモデル構築法について 明らかにしていく.現在の予定では,まず変数間の依存性を表すパラメータの初期値を与えたもと,生存時間と打ち切り時間を表す分布のKaplan-Meier法によるノンパラメトリックな推定を行い,続いて,スプライン等によるこれらの分布の補完を行った後,依存性を表すパラメータの推定を行う操作を繰り返すことで,生存時間の推定を行うことが可能であると考えている.この手法に関して,理論的構築とシミュレーションによる性能の検証を通して,研究を行っていく予定である.
|
Causes of Carryover |
(理由)本年度は新型コロナウィルスの影響,当初予定していた通りの結果が得られなかったことにより,予定していた学会参加に関わる費用の支出が無かった. (使用計画)使用計画としては,当初予定していたよりも国際会議参加費・交通費(飛行機代)が上がっているためその上乗せと,学会参加に必要な物品の購入を新たに行いたいと考えている.
|