2022 年度実施状況報告書

全身CT画像と診断レポートを複合した機械学習による大規模医療データセットの構築

研究課題

研究課題/領域番号	22K12152
研究機関	山口大学
研究代表者	間普真吾山口大学, 大学院創成科学研究科, 教授 (70434321)
研究分担者	呉本尭日本工業大学, 先進工学部, 教授 (40294657) 平野靖山口大学, 医学部附属病院, 准教授 (90324459)
研究期間 (年度)	2022-04-01 – 2025-03-31
キーワード	深層学習 / 医用画像 / 診断レポート / 異常検知 / 自然言語処理 / 自己符号化器
研究実績の概要	研究代表者らは，大規模なPET-CTデータとそれに対応する診断レポートを保有しており，これを機械学習に適したラベル付きデータセットの構築につなげる研究を行っている．しかし，診断レポートは全身に対して記述されており，部位ごとの記述ではないため，そのままでは各部位ごとの機械学習を行うことが難しい．したがって，今年度は東京大学大学院医学系研究科医療AI開発学講座が提供しており，大規模な臨床テキストで事前学習済みの自然言語系ニューラルネットワークであるUTH-BERTを用いて，診断レポートを部位ごとの記述に分割し，部位ごとの診断レポートとして再構築するシステムの開発を行った．本システムは，文単位で部位ラベルを付与するものであるが，これに前文の文脈を考慮するよう改良することで，識別性能が向上することを明らかにした．クラスラベルの付与されていない大規模画像データを機械学習に利用しやすいデータセットとするために，異常検知手法によって正常と異常に分類する研究を行った．具体的には，これまでに研究を行ってきたDAGMM（Deep Autoencoding Gaussian Mixture Model）とCAAE（Convolutional Adversarial Autoencoder）を組合せた新しい異常検知モデルを提案し，これを胸部CT画像に適用することで，正常CTスライスのみを訓練データとして学習し，テストデータの異常スライスを分離する研究を行った．DAGMMは正常データの分布を生成し，そこから外れたデータを異常と判定する方式であるが，これにCAAEによる正常データの分布をコンパクトにまとめる正則化を付与することによって，正常データと異常データの特徴量の分離が良くなることが明らかとなり，異常検知精度の向上も確認できた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由研究テーマである大規模医療データセットの構築に向けて，医用画像と診断レポートの活用の両面から研究を推進し，それぞれ良好な結果を得た．したがって，次年度に向けた基盤を構築でき，さらなる改良・融合が可能な状況であり，おおむね順調に進展していると判断した．
今後の研究の推進方策	今年度の成果を基盤として以下の研究を推進する．診断レポートの分類モデルについては，AIとユーザが協働で効率的なラベリングを行い，AIの性能向上を図る能動学習方式を構築する．さらに，文脈をより正確に把握できる注意機構を有するモデルを構築し，これと画像特徴を組み合わせる研究を行う．医用画像の分類に関し，異常データを全く用いない異常検知方式では実用的な精度を達成することが難しい．したがって，半教師あり学習型異常検知モデルを構築し，少数の異常データあるいは疑似異常データを活用した研究を行う．
次年度使用額が生じた理由	計算機関連機器に関する予算の支出を抑えることができたため次年度使用額が生じたが、研究成果を発表するための旅費および論文投稿料として活用する。

研究成果
(7件)

すべて 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (6件) (うち国際学会 1件、招待講演 1件)

[雑誌論文] 深層ニューラルネットワークを用いた肺聴診音の異常検知 ― DAGMM，Efficient GANの性能比較と改良 ―2022
- 著者名/発表者名
  若本亮佑，間普真吾，木戸尚治，呉本尭
- 雑誌名
  
  電気学会論文誌C（電子・情報・システム部門誌）
  
  巻: 142 ページ: 1328～1335
- DOI
  10.1541/ieejeiss.142.1328
- 査読あり
[学会発表] 自己符号化器を用いた胸部CT画像におけるびまん性肺疾患の教師なし陰影分類と異常検知2023
- 著者名/発表者名
  間普真吾，栗林雅刀，木戸尚治
- 学会等名
  第14回呼吸機能イメージング研究会学術集会
- 招待講演
[学会発表] 敵対的自己符号化器付きDAGMM を用いた胸部CT における異常スライス検知2023
- 著者名/発表者名
  藤本竜太朗，間普真吾，木戸尚治
- 学会等名
  第14回呼吸機能イメージング研究会学術集会
[学会発表] UTH-BERT を用いた医療診断レポートからの特徴抽出とその識別2023
- 著者名/発表者名
  前田健宏，間普真吾，木戸尚治
- 学会等名
  第14回呼吸機能イメージング研究会学術集会
[学会発表] Interpretable Anomaly Detection for Lung Sounds Using Topology2023
- 著者名/発表者名
  Ryosuke Wakamoto, Shingo Mabu
- 学会等名
  The 5th International Conference on Artificial Intelligence in Information and Communication
- 国際学会
[学会発表] Supervised Contrastive Learningを用いた胸部CT画像におけるびまん性肺疾患の陰影識別2022
- 著者名/発表者名
  森崎幹也，間普真吾，木戸尚治
- 学会等名
  第41回日本医用画像工学会大会
[学会発表] 半教師あり学習型CycleGANを用いた甲状腺組織画像のドメイン変換と識別器構築への応用2022
- 著者名/発表者名
  一氏良仁，間普真吾，八田聡美，稲井邦博，樋口翔平，木戸尚治
- 学会等名
  計測自動制御学会システム・情報部門学術講演会2022

2022 年度 実施状況報告書

全身CT画像と診断レポートを複合した機械学習による大規模医療データセットの構築

研究代表者

間普 真吾 山口大学, 大学院創成科学研究科, 教授 (70434321)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 深層ニューラルネットワークを用いた肺聴診音の異常検知 ― DAGMM，Efficient GANの性能比較と改良 ―2022

著者名/発表者名

雑誌名

DOI

[学会発表] 自己符号化器を用いた胸部CT画像におけるびまん性肺疾患の教師なし陰影分類と異常検知2023

著者名/発表者名

学会等名

[学会発表] 敵対的自己符号化器付きDAGMM を用いた胸部CT における 異常スライス検知2023

著者名/発表者名

学会等名

[学会発表] UTH-BERT を用いた医療診断レポートからの特徴抽出とその識別2023

著者名/発表者名

学会等名

[学会発表] Interpretable Anomaly Detection for Lung Sounds Using Topology2023

著者名/発表者名

学会等名

[学会発表] Supervised Contrastive Learningを用いた胸部CT画像におけるびまん性肺疾患の陰影識別2022

著者名/発表者名

学会等名

[学会発表] 半教師あり学習型CycleGANを用いた甲状腺組織画像のドメイン変換と識別器構築への応用2022

著者名/発表者名

学会等名

2022 年度実施状況報告書

間普真吾山口大学, 大学院創成科学研究科, 教授 (70434321)

[学会発表] 敵対的自己符号化器付きDAGMM を用いた胸部CT における異常スライス検知2023