研究実績の概要 |
本研究では、がん多層オミックスデータに対して深層学習を用いた発見的なアプローチを追及し、生体情報の階層的なネットワーク構造に内包される高次元空間内の相関関係を低次元に圧縮し、科学上意味のある結果を導き出すための方法論の構築に取り組んできた。 2019年度においては肺がんの多層オミックスデータ(transcriptomeデータ[RNA-seq]、miRNAデータ、epigeneticsデータ[DNAメチル化])に臨床情報を合わせ統合的に解析することで、肺がん患者の予後を予測する解析プラットフォームの構築に取り組んだ。研究戦略であるが、まず深層学習技術を用いて多層オミックスデータを低次元に圧縮し、生存に関する特徴量を、コックス比例ハザードモデルを用いて抽出した。続いてk-means clusteringを用いてクラスタリングを行い、クラスタリングされたグループ間で分散分析(analysis of variance: ANOVA)を行う事で、生存に関連する遺伝子群をランキングした。これらランキングされた遺伝子を上位から順に特徴量として、機械学習技術の一つであるsupport vector machine (SVM)のモデル生成に利用し、肺がん患者の分類を行ったところ、予後良好群と予後不良群の分類に成功した。多層オミックスデータに関して、DNAメチル化データを除いた、transcriptomeデータとmiRNAデータの二種類のデータを用いた場合においても、肺がん患者の予後良好群と予後不良群の分類に成功した。続いて、リスク評価のために2群間でパスウェイ解析を行ったところ、risk依存的なパスウェイが明らかになった。尚これらの成果は査読付き英文原著論文(Biomolecules, 10, 524 [2020])として既に発表している。
|