全身CT画像と診断レポートを複合した機械学習による大規模医療データセットの構築
Project/Area Number |
22K12152
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Yamaguchi University |
Principal Investigator |
間普 真吾 山口大学, 大学院創成科学研究科, 教授 (70434321)
|
Co-Investigator(Kenkyū-buntansha) |
呉本 尭 日本工業大学, 先進工学部, 教授 (40294657)
平野 靖 山口大学, 医学部附属病院, 准教授 (90324459)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 深層学習 / 医用画像 / 画像所見 / 自然言語処理 / 注意機構 / 特徴抽出 / 診断レポート / 異常検知 / 自己符号化器 |
Outline of Research at the Start |
医療データに対するコンピュータ支援診断は長く期待されながら広く普及するには至っていない.これは多様な部位や疾患に対する教師データを用意することが困難であることに起因する.本研究では,最小限の教師データ作成コストで高い信頼性を有する部位・疾患ラベルつき大規模医療データセットの構築を目的とし,教師ラベルを必要とせずに得られる可能な限りの情報,またはわずかな教師ラベルつきデータを手掛かりとした深層学習による医用画像・診断レポート解析統合型のアノテーションシステムを構築する.
|
Outline of Annual Research Achievements |
前年度に引き続き,PET-CT検査に付されている大量の診断レポート(画像所見)に対して,所見に含まれる各文が示す部位を識別(ラベリング)し,部位ごとの画像所見として再構築するシステムの改良を行った.前年度は,識別対象文とその前文を同時に入力することで,前文の文脈を考慮できるモデルの構築を行っていた.しかし,前文と識別対象文が指す部位が全く異なる場合,部位ラベリングに悪影響が生じることも明らかとなった.したがって,今年度は,ラベリングにおける前文の重要度を判定する注意機構を付与し,文脈に応じて適切に前文の考慮バランスを設定できるシステムを構築し,その性能を検証した.また,AIとユーザが共同で効率的なラベリングを行う能動学習を組み込んだ方式も開発した. これまでの研究では,CT画像のある特定のスライスを対象に,正常や異常のラベルを付与する研究が主であったが,たとえば胸部CTでは数百枚のスライスで1症例が構成されている.したがって,全スライスを総合的に考慮した識別器の構築が理想であり,3次元入力対応の深層学習を使用することが考えられるが,大量のメモリを搭載する非常に高価なGPUを使用しない限り,プログラムの実行が困難である.本問題の解決のため,3次元画像から重要な特徴を効果的に抽出可能な2つの方法,1)Axial断面,Sagittal断面,Coronal断面のそれぞれの方向からスライスをサンプリングし,多視点の情報を合成する方法,2)輝度ヒストグラムとテクスチャ特徴(LBPヒストグラム)で情報を表現して組み合わせることで、1症例のデータをコンパクトな形にまとめる方法を試みた.性能評価の結果,両手法とも,訓練データとテストデータで医療施設が異なる(撮影条件が異なる)場合に特に有用であることが分かった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
画像所見文のラベリングにおいて,注意機構も活用し文脈のより深い理解が可能なモデルに発展させることができており,さらに,文章と画像データを融合させる研究に進んでいる.また,数百枚以上のスライス画像で構成される症例データを有効活用するにあたって,効果的に情報を抽出できる方式を開発したことは,教師ラベルつき大規模医療データセットの構築の研究を効率良く進めることに寄与するため,おおむね順調に進展していると判断した.
|
Strategy for Future Research Activity |
今後は,所見文と画像データを組み合わせたマルチモーダル学習方式の研究を行い,各症例における異常の有無をラベリングできるシステムの構築を進める.この際,3次元データを効果的に扱うことができる今年度の成果との融合を検討し,ラベリング性能の向上を目指したい.
|
Report
(2 results)
Research Products
(16 results)