研究実績の概要 |
課題期間を通じ、機械学習手法(ベイズ正則型ニューラルネットワーク[BRNN]およびサポートベクトルマシン[SVM])により基本的検査項目を組み合せた甲状腺機能異常症のスクリーニングモデルを実装したクラウドサービスを開始した。これに検査値の時系列変化を併用する2時点予測モデルを追加・改良しながら、本手法の全国展開とさらなる精度改善を進めた。本モデルはクラウド開始後、治療を要する甲状腺中毒症を21例、甲状腺ホルモン減少症を4例発見することに成功し、見逃されていた患者QOLの向上に寄与した。 甲状腺中毒症においては、前回受診時から算出した検査値年間変動速度を新たな特徴量として定義した上でBRNNとSVMによるアンサンブル学習を実施した時系列予測モデルが顕著に精度を向上させた。このモデルは対象サンプル群において、ALP(アルカリホスファターゼ),TC(総コレステロール),S-Cr(血清クレアチニン),心拍数の4項目モデルでは感度を維持したまま偽陽性数を45名から24名に半減させ、さらにChE(コリンエステラーゼ)を追加した5項目2時点モデルは偽陽性が6名と、当初の偽陽性数から9割弱減少させる高い特異度を示した。 一方、甲状腺機能低下症ではLDH(乳酸デヒドロゲナーゼ),RBC(赤血球数),TC,S-Crの4項目モデルが高精度であったが、中毒症と同様に時系列モデル化しても精度の向上は認められなかった(ROC曲線下面積で1時点モデル0.989、2時点モデル0.986)。これは時系列モデル化する際の変動速度の取り扱いに起因する可能性があるとみて、最終年度では新たな学習手法として、値の時系列を直接取り扱えるリカレントニューラルネットワーク(RNN)を実装、ハイパーパラメータのチューニングから検討を行ったが、最終的には1時点モデルの精度に及ばなかった(RNN2時点モデルで同0.980)。
|