2021 Fiscal Year Annual Research Report
Integrated Multi-Omics Analysis Methodology with Image Transformation and Deep Learning for Pathophysiology and Drug Response Mechanisms
Project/Area Number |
20H03240
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
角田 達彦 東京大学, 大学院理学系研究科(理学部), 教授 (10273468)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 深層学習 / マルチオミクス / 画像変換 / ゲノミクス / 治療予測 |
Outline of Annual Research Achievements |
本研究は、オミクスデータを画像に変換し深層学習に用いる申請者の手法に基づき、マルチオミクス統合解析と画像認識を応用した手法を開発し、実データ解析により、薬剤応答予測などの精度が上がるか、背後にあるオミクスの特徴や構造の抽出が可能か、また薬剤応答予測に必要な方法論は何かを解明することを目的とする。2021年度は、データの画像変換と深層学習によるマルチオミクス解析手法を開発した。マルチオミクスは遺伝子発現、遺伝子変異、コピー数変化、メチル化とする。申請者のDeepInsight(Scientific Reports 2019)による画像データへの変換が有効か、そして最適なアーキテクチャを明確にするため、マルチオミクスの各層を画像変換した後にDNNでそれらを結合する方法を実装した。次に、マルチオミクスデータから深層学習によって特徴抽出し、パスウェイ解析により解釈するDeepFeature法を開発し出版した(Briefings in Bioinformatics 2021)。特徴同定手法をClass Activation Map(CAM)で実装し、DNNの中間層から遺伝子群の形で同定する方法である。TCGAの実データを用いて解析したところ、従来の機械学習に比べて既存のがんのパスウェイを同定する能力がはるかに高いことを示し、またがんに関わる新規のパスウェイの発見にも成功した(Briefings in Bioinformatics 2021)。さらに、実データ評価のため、独自の肺腺がん、大腸がん、肝がん、腎がんと、TCGA など公共のがんのマルチオミクスデータ、薬剤奏効(RECIST)、OS、RFS、PFSを整備した。解析の一例として、進行性大腸がんで免疫学的に新たな分類を発見し、その分類の患者の予後が極端に悪い原因を免疫編集の観点から解明し出版した(iScience 2022)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度、私たちがこれまで開発してきたDeepInsight(Scientific Reports 2019)をベースとし、遺伝子発現、遺伝子変異、コピー数変化からなるマルチオミクスデータに対して画像変換と深層学習により解析する方法を開発することができた。特にマルチオミクスの各層を画像変換した後にDNNでそれらを結合する方法を実装することで、がんの薬剤応答予測に対し、現段階で既に好成績を達成している。次に、マルチオミクスデータからの深層学習による特徴抽出とそれをCAMとパスウェイ解析により解釈するDeepFeature法を開発し論文化することができた(Briefings in Bioinformatics 2021)。TCGAの実データで、従来の機械学習に比べて同定能力がはるかに高いことを示し、またがんに関わる新規のパスウェイの発見にも成功している(Briefings in Bioinformatics 2021)。さらに、実データ評価のため、独自の肺腺がん、大腸がん、肝がん、腎がんと、TCGA など公共のがんのマルチオミクスデータ、薬剤奏効(RECIST)、OS、RFS、PFSを整備した。解析の一例として、進行性大腸がんで免疫学的に新たな分類を発見し、その分類の患者の予後が極端に悪い原因を免疫編集の観点から解明した(iScience 2022)。これらのことから総合的に判断し、計画は順調に進んでいると考える。
|
Strategy for Future Research Activity |
2022年度以降の研究計画として、本年度開発したがんの薬剤応答予測のためのアーキテクチャの洗練化と評価を行う。これには変異・発現・コピー数データをそれぞれDeepInsight法に適用する方法を用いること、そしてTCGA、ICGC肝がんやGEOなどで学習し転移学習することを検討する。次に、本年度論文化した深層学習による特徴の抽出と解釈の手法を薬剤応答マルチオミクスデータに適用し、薬剤応答関連遺伝子の同定と背後にあるメカニズムの解明を狙う。学習にはGDSC/CCLEの細胞株の薬剤応答データを用い、評価ではTCGAとPDXを用いて検証する。細胞株の薬剤応答データでは、IC50に対する閾値を変化させた場合の挙動の違いなどを探る。加え、独自の肺腺がん、大腸がん、肝がん、腎がんを用いて検証を行う。この過程で特徴として同定した遺伝子群をIngenuity Pathways Analysis(IPA)でパスウェイにマップし、転写因子や文献知識でつなぐ。続き、これらをMOLI手法、そしてオミクスの各層単独の場合と比較する。さらに独自のがん多層オミクスデータで精度を測定し、精度の普遍性の有無を明確にする。さらに、特徴抽出の段階で薬剤応答因子を導くセミスーパーバイズドな方法(Bair & Tibshirani, PLoS Biology 2004)を上記の画像変換マルチオミクス深層学習に導入し、精度の向上の有無を明らかにすることを予定する。これらから得られた結果を既存の薬剤 応答パスウェイと比較することにより、正しさの検証とがんの薬剤応答や環境に関する未知のメカニズムの発見を目指す。
|