2022 Fiscal Year Research-status Report
がんのRadiogenomicsデータに対する深層学習による革新的特徴量選択
Project/Area Number |
21K07590
|
Research Institution | Chiba University |
Principal Investigator |
森 康久仁 千葉大学, 大学院工学研究院, 助教 (40361414)
|
Co-Investigator(Kenkyū-buntansha) |
星野 敢 千葉県がんセンター(研究所), 消化器外科, 主任医長 (10400904)
横田 元 千葉大学, 大学院医学研究院, 講師 (20649280)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 特徴選択 / 機械学習 / 医療画像データ |
Outline of Annual Research Achievements |
本研究では,広義の機械学習などの工学的なアプローチを,医療画像データ・遺伝子発現データ・生化学データといった様々な医療データに応用し,癌の層別化に関わる臨床的要因を選択する統一的な方法論を構築することを目的とする.本年度は,主にX線やCT,MR画像などの医療画像データが果たす役割とその特質を工学的な観点から理解し特徴量選択の方法論に応用することを目標とし,様々な臨床的なタスクにおいての解析を行った. 本年度は主に以下の3つのテーマに関して取り組み,それぞれの研究成果は学会発表という形で行った. 1)X線画像中の特定の領域を取り出すことが可能な特徴量を抽出する深層学習モデルの提案:特にU-Netベースのネットワーク構造にクラス領域の不均衡性を考慮したロス関数を組み込むことで,適切な特徴量を抽出するネットワークを学習によって得られることを確認した. 2)医療画像データに対する深層距離学習が特徴量の抽出に与える影響についての検討:データ間の距離または類似度に基づいてクラスが各々分離されるように入力データから特徴量空間への変換を学習させる手法である深層距離学習を医療画像データに適応した.特にデータ数がそれほど多くない場合でもTriplet Lossを用いることで医療画像からクラス分類に有効な特徴量を抽出できる可能性を示唆した. 3)解像度の低い医療画像データから特徴量を抽出する学習モデルについて:解像度の低い医療画像データから,クラス分類に有効な特徴量を抽出するための方法論を検討した.解像度の低い画像データは,多段の畳み込み層を適用して特徴抽出することが難しいため,距離学習を用いることで有効な特徴量を抽出できる可能性を示唆した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
近年の機械学習では「いかに質の良いデータを大量に得ることができるか」が重要なポイントになっている.その点において,医療データは欠損も多く取得にある程度の制約と様々なコストがかかり,「質の良い」データを「大量に」得ることは難しい.実際の臨床データを用いた学習モデルの訓練が適切に行えず,データの前処理・モデル構造・学習方法・その他,どこに問題があるのかは明確にはわからず,問題解決に想定以上に時間がかかっている.これらのことが,研究がやや遅れている一番の理由と考えている.
|
Strategy for Future Research Activity |
現在まで,生化学データなどを用いて,特徴量選択手法の精度改善を試みているものの有意な改善には至っておらず,深層学習と特徴量選択に関して更なる検討が必要である.具体的には,Attentionなどの技術を特徴選択に応用できないかを検討したい.また,多くのテーブル型の医療データは欠損している場合が多い.そのため,欠損が発生したメカニズムを理解し,これらの欠損したデータを適切に統計解析する方法論を利用する必要があると考えている.
|
Causes of Carryover |
適切なハードウェアが選定できず,一部使用できなかった研究費があった.次年度にデータの取得・管理や実験結果の評価時に必要な物品の購入に使用する予定である.
|