医療分野ではデータの一般公開が困難なため研究で使用できる十分な数のデータセットを集めることが難しいという課題がある.データ不足を補うためにデータ拡張と呼ばれる手法が存在するが,医療画像に特化したデータ拡張手法はいまだ開発されていない.本研究では,データ間の特徴合成によるデータ拡張を実施し,医療データに対して効果的なデータ拡張を実現する.最終年度は不妊症患者の子宮超音波画像に対して中間画像生成によるデータ拡張を実施し,妊娠予測を行う診断支援システムの学習データとして利用し評価を行った. 不妊症診断に利用される子宮画像は,患者ごとに子宮の形状や向き,大きさといった個人差による特徴が大きくあらわれる.このため,患者間の子宮画像で中間画像を生成しても,現実に存在するような子宮の画像を生成することは困難である.申請者によるこれまでの研究成果により,子宮画像を用いた機械学習による妊娠予測では元画像を利用するよりも,子宮運動の特徴を抽出した速度画像を利用することが効果的であることがわかっている.この速度画像では,子宮の形状や向き,大きさといった個人差による特徴がおおよそ除去されている.そこで,速度画像を用いて患者間の中間データを生成することで効果的なデータ拡張が実現できると考えた. 実際に元画像と速度画像の中間画像生成によるデータ拡張を行い,CNNによる妊娠予測モデルを生成した.各モデルの予測結果から得られたROC曲線のAUCによる評価を行った結果,速度画像の中間画像によるモデルの方が高いAUCを有していることがわかった.また,速度画像に対して回転処理を加える従来的な拡張手法を適用したデータセットと比較すると,中間画像生成によるデータセットの方が高い精度を有していることが確認できた.これらの結果より,速度画像に対する中間画像生成が効果的な拡張手法であることを確認した.
|