研究課題/領域番号 |
20K19857
|
研究機関 | 北海道大学 |
研究代表者 |
藤後 廉 北海道大学, 数理・データサイエンス教育研究センター, 特任助教 (60840395)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | 機械学習 / 深層学習 / 異常検知 / 医用画像 / DAGMM / データクレンジング / 胃X線 / 食道X線 |
研究実績の概要 |
本研究では,胃X線画像を対象とした機械学習に基づくデータクレンジング技術の構築を目的とする.医用画像解析分野において,大規模なデータに基づく教師有り学習は有効性が認識されつつあり,診断支援技術としての実用化が期待されている.一方で,現在提案されている多くの手法は,モデルの構築および評価にとどまっており,データセットの構築に係る労力については考慮されていない.そこで本研究では,機械学習の社会実装へ向け必要となるデータセット構築の部分に注目し,効率的にデータクレンジングを実現可能とする技術を構築する.本研究によりデータセット構築に係る労力を削減可能とすることで,あらゆる医用画像に対する診断支援技術としての社会実装の加速に貢献する. 本年度では,胃X線検査を対象として研究を遂行した.一般的な胃X線検査では,胃X線画像に加えて,食道X線画像も撮像される.胃がんリスク推定モデルの構築を目的とした場合に,食道X線画像の混入は精度低下の要因となるため,事前にクレンジングが必要となる.しかしながら,手動でのデータクレンジングは多大な労力を要することが課題となっていた.そこで本研究では,胃X線画像と食道X線画像の画像特徴が異なるという性質に着目し,異常検知に基づく食道X線画像の自動データクレンジング手法を構築した.提案手法では具体的に,Deep Autoencoding Gaussian Mixture Modelに基づく異常検知手法を構築し,正常画像として胃X線画像を用いてその分布の学習を行なった.実験の結果,感度と特異度の調和平均96.8%で食道X線画像を自動的に除去できることが明らかとなった.研究成果は,学術論文誌Computers in Biology and Medicineへ採録されている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は,研究計画の内容1「異常検知モデルに基づくデータクレンジング技術の構築」について検討を行なった.本研究では,異常検知に基づき胃X線画像の性質を予め学習したモデルを構築することで,データクレンジングを可能とする技術を構築した.具体的には,特徴抽出器として特徴の再構成の観点から次元削減を行うDeep Auto Encoder を用いた.次に,抽出された特徴を用いて学習するネットワークを構築することで,異常検知モデルを構築した.構築した異常検知モデルにより,入力画像に対する異常度(胃X線画像らしさ)を算出可能となり,異常度の閾値処理により食道X線画像などの学習に不要な画像の自動除去を実現する.本研究では,最新の異常検知手法であるDeep Autoencoding Gaussian Mixture Model(DAGMM)を本タスク用へと拡張し,異常検知モデルを構築した. 本検討では,6012症例を用いた検討を実施し,感度95.6%,特異度98.0%,調和平均96.8%の識別精度を達成した.このとき,比較手法として用いたDAGMMは感度93.2%,特異度88.3%,調和平均90.7%であり,AnoGANは感度83.5%,特異度83.3%,調和平均83.4%,OCSVMは感度93.2%,特異度93.5%,調和平均93.4%であった.以上から,提案手法は,複数の既存の異常検知手法と比較しても高い精度が得られることが確認された.本研究成果は,医療情報系の学術論文しComputers in Biology and Medicineへ採録されている.本年度は,技術の横展開についても検討を行い,学術論文誌に2件の採録,世界最大の画像処理国際会議ICIPを含む国際会議での3件の発表,映像情報メディア関連の国内学会での2件の発表に至った.
|
今後の研究の推進方策 |
令和2年度では,当初の予定通り,内容1「異常検知モデルに基づくデータクレンジング技術の構築」が完了した.また,技術の汎用性についても検討を行い,他の医用画像での有効性等について検証を行なった.また,得られた研究成果を学術論文誌や国際会議を通して発表した.今年度は,当初の計画通り,内容1にて構築した異常検知モデルの高度化を行う予定である.臨床現場では常に新たなデータが取得されると考えられる.そこで構築した異常検知モデルに対し,新たな教師データが追加された際にそのデータに重みづけしてモデルパラメータを更新する動的異常検知への拡張を行う.具体的には,異常検知モデルの最適化を行う際に,新たなデータに対する損失関数を追加し,これまで得られたデータと区別して最適化を行う.これにより,データの増加に合わせてモデルの高精度化を自律的に行うことが可能となると考えられる.また,本年度からは技術の横展開の検討も積極的に進め,技術の社会実装や実証実験,共同研究などにも結びつけたいと考えている.そのために基盤技術を多様なデータに対して適用していき,研究領域の拡大に努めたいと考えている.
|
次年度使用額が生じた理由 |
令和2年度では,世界的に大流行した新型コロナウイルスの影響によって,国際学会等がオンライン開催へ変更され,旅費や学会登録費が使用予定よりも減少ため,次年度使用額が生じた. この傾向は,令和3年度も継続すると考えられるため,より多くの学会や学術論文誌にて研究成果の発表を行う予定である.また,これまで使用してきた計算機をさらに充実させ,研究スピードを加速させるためにGPU (NVIDIA Geforce GTX 2080TiやNVIDIA TITAN V),PC(iMac miniやMacbook Pro)等の購入を予定している. これに伴い,必要となるデータ量が増加すると考えられるため,必要に応じて,データストレージも購入予定である.なお本ストレージには内臓ストレージに加え,データバックアップ用のSSDやHDDを含む予定である.
|