2021 Fiscal Year Research-status Report
医用画像を対象とした機械学習に基づく逐次的データクレンジング技術の構築
Project/Area Number |
20K19857
|
Research Institution | Hokkaido University |
Principal Investigator |
藤後 廉 北海道大学, 情報科学研究院, 特任助教 (60840395)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 機械学習 / 深層学習 / 異常検知 / 医用画像 / DAGMM / データクレンジング / 胃X線 / 食道X線 |
Outline of Annual Research Achievements |
本研究では,胃X線画像を対象とした機械学習に基づくデータクレンジング技術の構築を目的とする.医用画像解析分野において,大規模なデータに基づく教師有り学習は有効性が認識されつつあり,診断支援技術としての実用化が期待されている.一方で,現在提案されている多くの手法は,モデルの構築および評価にとどまっており,データセットの構築に係る労力については考慮されていない.機械学習による診断支援技術を実社会応用するためには,データへのラベリングコストを含めたトータルフォーマンスを考慮する必要がある.そこで本研究では,機械学習の社会実装へ向け必要となるデータセット構築の部分に注目し,効率的にデータクレンジングを実現可能とする技術を構築する.本研究によりデータセット構築に係る労力を削減可能とすることで,あらゆる医用画像に対する診断支援技術としての社会実装の加速に貢献する. 本年度では,主に前年度に構築した異常検知技術の他分野への応用可能性について検討を行った.具体的には,前年度に構築したDeep Autoencoding Gaussian Mixture Modelに基づく異常検知手法を電子顕微鏡画像におけるゴム材料の劣化領域検出に応用し,その成果がNature Index材料科学特集号にて紹介されている.Nature Indexとは,世界トップクラスの研究成果を集約するデータベースである.加えて,データクレンジング技術により整形されたデータセットを利用することで,より高度な研究を実施することが可能となった.具体的には,自己教師あり学習に基づきラベルを必要としないより汎用的な学習方法に基づく疾患識別手法を構築し,胃X線画像のみならず,肺X線画像や内視鏡画像への適用により有効性を確認した.本成果についてはScientific Americanで次世代技術として紹介されている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,研究計画の内容2「オンライン学習導入による動的異常検知モデルの構築」について検討を行なった.本研究では,異常検知に基づき胃X線画像の性質を予め学習したモデルを構築することで,データクレンジングを可能とする技術を構築した.具体的には,特徴抽出器として特徴の再構成の観点から次元削減を行うDeep Auto Encoder を用いた.次に,抽出された特徴を用いて学習するネットワークを構築することで,異常検知モデルを構築した.構築した異常検知モデルにより,入力画像に対する異常度(胃X線画像らしさ)を算出可能となり,異常度の閾値処理により食道X線画像などの学習に不要な画像の自動除去を実現する.本研究では,最新の異常検知手法であるDeep Autoencoding Gaussian Mixture Model(DAGMM)を本タスク用へと拡張し,異常検知モデルを構築した.さらに,本異常検知モデルの有効性検証を追加データや,複数データセットを用いて有効性検証を行った.本検討によって,逐次的に(オンライン)学習データを追加する有効性が示された. 本研究において構築した異常検知技術は,他分野のデータにおいても有効性を発揮することが明らかとなっている.具体的には,胃X線画像に留まらず,肺X線画像や内視鏡画像における有効性,材料科学分野における電子顕微鏡画像における有効性が示されている.本成果は,学術論文誌に採録されるのみならず,世界トップクラスの研究成果を集約するデータベースであるNature Index派の掲載や,世界最古の一般科学雑誌であるScientific Americanにて次世代技術として紹介されるなど,世界的な注目を集める成果となった.
|
Strategy for Future Research Activity |
令和3年度では,当初の予定通り,令和2年度に構築済みの内容1「異常検知モデルに基づくデータクレンジング技術の構築」に続き,内容2「オンライン学習導入による動的異常検知モデルの構築」を完了した.また,技術の汎用性向上や横展開についても検討を行い,肺X線画像や内視鏡画像,ゴム材料の電子顕微鏡画像など多様なデータを用いた有効性検証を実施した.また,得られた研究成果を学術論文誌や国際会議を通して発表した.令和4年度は,当初の計画通り,内容1および内容2にて構築した異常検知モデルの高度化を行う予定である.令和3年度までに得られた研究成果において,ある一定の条件下においては高性能な異常検知モデルの実現は有効性検証も含めて完了している.本データクレンジング技術によりデータ整形を行うことで,ラベルを用いずにデータの性質を把握することが期待できる.これらを踏まえ,今後は構築した技術を自己教師あり学習等のラベルなしデータを活用する学習手法と組み合わせることで,汎用性向上に向けた検討を開始する予定である. なお,令和4年度についても得られた研究成果の横展開を拡張し,国際会議や学術論文誌への投稿を積極的に行っていく予定である.具体的には,医療AIのトップ国際会議である,Medical Image Computing and Computer Assisted Intervention(MICCAI)や画像処理分野の世界最大規模の国際会議International Conference on Image Processing(ICIP)などへの投稿を予定している.
|
Causes of Carryover |
令和3年度では,令和2年度に引き続き,世界的に大流行した新型コロナウイルスの影響によって,国際学会等がオンライン開催へ変更され,旅費や学会登録費が少なくなったため,次年度使用額が生じた.令和4年度には現地参加の学会も増加すると思われるが,より多くの学会や学術論文誌にて研究成果の発表を行う予定である.加えて,研究スピードを加速させるためにGPU,PC等の購入を予定している.技術展開のために多様なデータを対象とすることを想定しており,必要となるデータ量についても増加すると考えられるため,必要に応じて,データストレージも購入予定である.
|
Research Products
(10 results)