今回はLassoで変数選択を行ってからの古典的なロジスティック回帰がもっとも良い性能を示し、小児の先天性心疾患手術で高リスク因子となるものを特定できた。統計モデルはデータの内容によっては複雑な機械学習やディープニューラルネットワークよりも優れていることが知られているが、レセプトやDPCのような診療報酬データは0と1など離散的な整数が主のスパースなデータ構造をしており、ロジスティック回帰のような古典的な統計モデルが力を発揮すると考えられた。診療報酬データは日本全国共通の規格であるため、ロジスティック回帰のようなよく知られた計算コストの低い手法で解析を行えることは社会的意義も高いと考えられた。
|