数理モデル作成の問題点として、訓練データを用いて作成した数理モデルが、テストデータでもいかに精度よく識別できるかということが重要である。すなわち過学習をいかに減らし、汎化性能の高いモデルを作成するかということである。そのためには、モデルに用いる説明変数をできるだけ減らした上で精度のいいモデルを作成ことがポイントである。 昨年度までに、PCRを用いた遺伝子の発現定量解析についてある程度絞り込んだ説明変数(発現遺伝子マーカー)を総当たりで組み合わせてそのうつ病診断に対する識別精度を検討し、5個まで絞り込んだ発現遺伝子マーカーセットを用いて精度の高いモデルが作成できることを示した。本年度は、この発現遺伝子マーカーセットによる数理モデルが、うつ病以外の精神神経系疾患、すなわち、総合失調症、双極性障害に対する識別精度はどうなのかを調べることで、その汎化性能をさらに詳細に検討した。 その結果、今回の数理モデルは、うつ病と健常者のみならず、うつ病とうつ病以外の精神神経系疾患(総合失調症や双極性障害)も識別できるモデルであることを示した。しかしながら、うつ病と健常者のみの間での識別精度(感度85%、特異度89%)よりも、うつ病検体とうつ病以外の検体(総合失調症、双極性障害、健常者)での精度はやや落ちることがわかった(感度64%、特異度67.9%)。 したがって、これらのマーカーセットを用いた数理モデルは、うつ病と健常者は識別精度よく識別できるが、うつ病検体と他の精神神経系疾患などを含む検体との間の識別精度はやや落ちるため、うつ病特異的な臨床診断薬としての能力はやや劣っていることが示された。
|