研究課題/領域番号 |
22K12152
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 山口大学 |
研究代表者 |
間普 真吾 山口大学, 大学院創成科学研究科, 教授 (70434321)
|
研究分担者 |
呉本 尭 日本工業大学, 先進工学部, 教授 (40294657)
平野 靖 山口大学, 医学部附属病院, 准教授 (90324459)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 深層学習 / 医用画像 / 診断レポート / 異常検知 / 自然言語処理 / 自己符号化器 |
研究開始時の研究の概要 |
医療データに対するコンピュータ支援診断は長く期待されながら広く普及するには至っていない.これは多様な部位や疾患に対する教師データを用意することが困難であることに起因する.本研究では,最小限の教師データ作成コストで高い信頼性を有する部位・疾患ラベルつき大規模医療データセットの構築を目的とし,教師ラベルを必要とせずに得られる可能な限りの情報,またはわずかな教師ラベルつきデータを手掛かりとした深層学習による医用画像・診断レポート解析統合型のアノテーションシステムを構築する.
|
研究実績の概要 |
研究代表者らは,大規模なPET-CTデータとそれに対応する診断レポートを保有しており,これを機械学習に適したラベル付きデータセットの構築につなげる研究を行っている.しかし,診断レポートは全身に対して記述されており,部位ごとの記述ではないため,そのままでは各部位ごとの機械学習を行うことが難しい.したがって,今年度は東京大学大学院医学系研究科医療AI開発学講座が提供しており,大規模な臨床テキストで事前学習済みの自然言語系ニューラルネットワークであるUTH-BERTを用いて,診断レポートを部位ごとの記述に分割し,部位ごとの診断レポートとして再構築するシステムの開発を行った.本システムは,文単位で部位ラベルを付与するものであるが,これに前文の文脈を考慮するよう改良することで,識別性能が向上することを明らかにした.
クラスラベルの付与されていない大規模画像データを機械学習に利用しやすいデータセットとするために,異常検知手法によって正常と異常に分類する研究を行った.具体的には,これまでに研究を行ってきたDAGMM(Deep Autoencoding Gaussian Mixture Model)とCAAE(Convolutional Adversarial Autoencoder)を組合せた新しい異常検知モデルを提案し,これを胸部CT画像に適用することで,正常CTスライスのみを訓練データとして学習し,テストデータの異常スライスを分離する研究を行った.DAGMMは正常データの分布を生成し,そこから外れたデータを異常と判定する方式であるが,これにCAAEによる正常データの分布をコンパクトにまとめる正則化を付与することによって,正常データと異常データの特徴量の分離が良くなることが明らかとなり,異常検知精度の向上も確認できた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究テーマである大規模医療データセットの構築に向けて,医用画像と診断レポートの活用の両面から研究を推進し,それぞれ良好な結果を得た.したがって,次年度に向けた基盤を構築でき,さらなる改良・融合が可能な状況であり,おおむね順調に進展していると判断した.
|
今後の研究の推進方策 |
今年度の成果を基盤として以下の研究を推進する. 診断レポートの分類モデルについては,AIとユーザが協働で効率的なラベリングを行い,AIの性能向上を図る能動学習方式を構築する.さらに,文脈をより正確に把握できる注意機構を有するモデルを構築し,これと画像特徴を組み合わせる研究を行う. 医用画像の分類に関し,異常データを全く用いない異常検知方式では実用的な精度を達成することが難しい.したがって,半教師あり学習型異常検知モデルを構築し,少数の異常データあるいは疑似異常データを活用した研究を行う.
|