研究課題/領域番号 |
22K12152
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 山口大学 |
研究代表者 |
間普 真吾 山口大学, 大学院創成科学研究科, 教授 (70434321)
|
研究分担者 |
呉本 尭 日本工業大学, 先進工学部, 教授 (40294657)
平野 靖 山口大学, 医学部附属病院, 准教授 (90324459)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 深層学習 / 医用画像 / 画像所見 / 自然言語処理 / 注意機構 / 特徴抽出 / 診断レポート / 異常検知 / 自己符号化器 |
研究開始時の研究の概要 |
医療データに対するコンピュータ支援診断は長く期待されながら広く普及するには至っていない.これは多様な部位や疾患に対する教師データを用意することが困難であることに起因する.本研究では,最小限の教師データ作成コストで高い信頼性を有する部位・疾患ラベルつき大規模医療データセットの構築を目的とし,教師ラベルを必要とせずに得られる可能な限りの情報,またはわずかな教師ラベルつきデータを手掛かりとした深層学習による医用画像・診断レポート解析統合型のアノテーションシステムを構築する.
|
研究実績の概要 |
前年度に引き続き,PET-CT検査に付されている大量の診断レポート(画像所見)に対して,所見に含まれる各文が示す部位を識別(ラベリング)し,部位ごとの画像所見として再構築するシステムの改良を行った.前年度は,識別対象文とその前文を同時に入力することで,前文の文脈を考慮できるモデルの構築を行っていた.しかし,前文と識別対象文が指す部位が全く異なる場合,部位ラベリングに悪影響が生じることも明らかとなった.したがって,今年度は,ラベリングにおける前文の重要度を判定する注意機構を付与し,文脈に応じて適切に前文の考慮バランスを設定できるシステムを構築し,その性能を検証した.また,AIとユーザが共同で効率的なラベリングを行う能動学習を組み込んだ方式も開発した. これまでの研究では,CT画像のある特定のスライスを対象に,正常や異常のラベルを付与する研究が主であったが,たとえば胸部CTでは数百枚のスライスで1症例が構成されている.したがって,全スライスを総合的に考慮した識別器の構築が理想であり,3次元入力対応の深層学習を使用することが考えられるが,大量のメモリを搭載する非常に高価なGPUを使用しない限り,プログラムの実行が困難である.本問題の解決のため,3次元画像から重要な特徴を効果的に抽出可能な2つの方法,1)Axial断面,Sagittal断面,Coronal断面のそれぞれの方向からスライスをサンプリングし,多視点の情報を合成する方法,2)輝度ヒストグラムとテクスチャ特徴(LBPヒストグラム)で情報を表現して組み合わせることで、1症例のデータをコンパクトな形にまとめる方法を試みた.性能評価の結果,両手法とも,訓練データとテストデータで医療施設が異なる(撮影条件が異なる)場合に特に有用であることが分かった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
画像所見文のラベリングにおいて,注意機構も活用し文脈のより深い理解が可能なモデルに発展させることができており,さらに,文章と画像データを融合させる研究に進んでいる.また,数百枚以上のスライス画像で構成される症例データを有効活用するにあたって,効果的に情報を抽出できる方式を開発したことは,教師ラベルつき大規模医療データセットの構築の研究を効率良く進めることに寄与するため,おおむね順調に進展していると判断した.
|
今後の研究の推進方策 |
今後は,所見文と画像データを組み合わせたマルチモーダル学習方式の研究を行い,各症例における異常の有無をラベリングできるシステムの構築を進める.この際,3次元データを効果的に扱うことができる今年度の成果との融合を検討し,ラベリング性能の向上を目指したい.
|