本研究では,深層学習の優れた特徴抽出能力を活用し,医療画像データ・遺伝子発現データ・生化学データなど,様々な医療データをマルチモーダル的に適用し,癌の層別化に関わる臨床的要因を特定・選択する統一的な方法論を構築することを目的としている.本年度は,医療画像データだけでなくカルテ情報が機械学習による分類問題においてどのよう性質をもっているかを解析し,新たなマルチモーダルなモデルにより特徴量選択の方法論に応用することを目標とし,様々な臨床的なタスクにおいての解析を行った.本年度は各画像データに対応したゲノム情報のデータを利用することができず,Radiogenomics的な解析をすることができなかったため,様々なモダリティのデータに対する特徴量抽出の方法論についての研究を集中的に行った.それぞれの研究成果は電子情報通信学会にて発表を行った. 3年間の研究機関全体を通した代表的な成果として,深層学習のモデル中に特徴の重要度を学習により推定する特徴選択層を提案した.本研究による提案したモデルを,消化器癌の中でもっとも予後不良の悪性腫瘍である膵臓がん患者の遺伝子発現データに対して適用した.その結果,膵臓がん組織と正常な膵臓組織を識別するタスクでは,ACACB,ADAMTS6,NCAM1,CADPSという遺伝子の関連性を見出し,1年予後に関して生存・非生存を識別するタスクではCD1D,PLA2G16,DACH1,SOWAHAという遺伝子の関連性を見出した.The Cancer Genome Atlasのデータセットによれば,これらの遺伝子はすべて膵臓がんの予後因子であることが示されており,本研究により提案された方法により選択された特徴量が,一定の確信度を持って有効であることを確認することができたと言える.
|