研究課題/領域番号 |
19K12206
|
研究機関 | 東北医科薬科大学 |
研究代表者 |
青木 空眞 東北医科薬科大学, 薬学部, 助教 (40584462)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 甲状腺機能異常症 / 機械学習 / 人工知能 / 医療統計 / 基本的検査 / 時系列解析 / スクリーニング |
研究実績の概要 |
甲状腺機能低下症患者群において時系列追跡可能なサンプルを14名確保し、乳酸デヒドロゲナーゼ(LDH), 血清クレアチニン(S-Cr),赤血球(RBC), 総コレステロール(TC)の検査4項目による時系列解析モデルの構築を試みた。検査値は男女の性差について補正し、脂質異常症の服薬補正も行った上で、受診2時点間の検査値年間変動速度を算出した。こうして求めた患者群14名と健常群42名の検査4項目+時系列速度4項目の計8項目セットを用いて機械学習(人工知能)手法の一つであるベイズ正則型ニューラルネットワーク(BRNN)により学習させ、従来の1時点予測モデルと2時点予測モデルを同条件で比較可能なよう並列に構築した。学習データについては交差検証法(Leave-one-out)で予測率を算出することで、既知のデータを予測しないようにして評価を行い、さらに甲状腺機能異常者を除いた人間ドック受診者4,571名をテストデータとして予測することで特異度の評価を実施した。結果として、4項目のみを用いた従来の1時点予測モデルではROCの曲線下面積は0.990、4項目+速度4項目の8項目セットによる2時点予測モデルでは0.987とほとんど精度に変化が見られず、さらに詳しく予測結果の誤差二乗和を評価すると、むしろ2時点予測モデルの方が精度の低下傾向が確認され、当初の見通しとは逆の結果が得られた。この結果をもたらした原因について各サンプルの予測率と検査値を突き合わせて確認したところ、甲状腺中毒症と比べると機能低下症では検査値の変動が緩やかであり、2時点間の変動を用いるだけでは情報が不十分であることや、サンプルサイズがまだ不足している可能性、あるいは時系列速度で考えると必ずしもこの選択された4項目の速度が有用であるとは限らない可能性が示唆された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
昨年来、新型コロナウィルス禍の中でサンプルの収集や解析進捗、学会のキャンセルなどがあり遅れていたところであるが、今年度は研究作業は比較的進捗した。一方、得られた成果としては当初の見込みと異なり、甲状腺中毒症解析の時は偽陽性の大幅な改善が見られた2時点時系列モデルは機能低下症では精度向上に寄与しないという結果が得られたため、これに対する原因の究明と改善策の立案など、さらなる解析の必要性が認められた。
|
今後の研究の推進方策 |
今回得られた成果から、特に「時系列速度とすると必ずしもこの選択された4項目の速度も有用であるとは限らない可能性」について掘り下げて検討する。このLDH, S-Cr, RBC, TCの4項目は、基本的検査値20項目以上の中から、交絡因子なども考慮した上で特に有用なものとして抽出した項目であるが、これらの項目の時系列速度が全て有用であるかどうかはこれまで未検討であった。さらに、時系列速度として考えるならばこの4項目からだけでなく、他の時系列速度が有用である可能性も否定できないことから、場合に応じて有用性の探索範囲を広げることを考えていきたい。また、構築に用いる機械学習手法についても、時系列をリカレントニューラルネットワークで評価するなど、新規の手法についても選択肢に入れて考慮したい。
|
次年度使用額が生じた理由 |
昨年度より新型コロナウィルス禍の中で当初予定の学会などのキャンセルが続き、主要な使途と見込んでいた学会発表の旅費と参加費について引き続き積算的に余剰が生じている。また解析結果の論文化費用についても、当初見込んでいた結果からやや外れたものであったため、まだ追加の解析検討が必要となった。 次年度は引き続き先述の研究実施計画に沿った解析を進めて論文化を目指すものとし、必要な解析ソフトウェアや端末等も増備することで使用する予定である。
|