2021 Fiscal Year Research-status Report
RNA-seq解析における深層学習方法論の開発と肉腫診療への応用
Project/Area Number |
20K09453
|
Research Institution | The University of Tokyo |
Principal Investigator |
小林 寛 東京大学, 医学部附属病院, 講師 (20407951)
|
Co-Investigator(Kenkyū-buntansha) |
篠田 裕介 埼玉医科大学, 医学部, 教授 (80456110) [Withdrawn]
谷口 優樹 東京大学, 医学部附属病院, 特任准教授 (80722165)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 骨軟部腫瘍 |
Outline of Annual Research Achievements |
多数の亜型がある軟部肉腫において最も頻度が高い組織型である未分化多形肉腫は、『明確な分化方向や特異的融合遺伝子を持つ腫瘍』を除外した結果として診断される腫瘍である。本研究は、未分化多型肉腫のRNA-seq解析を用い、発現パターンを基にした再分類を行うとともに、新規治療標的・バイオマーカー を同定することを目的としている。肉腫は軟部組織に発生する悪性腫瘍であり、その起源細胞は血管、脂肪、骨、神経など多岐にわたる。そこで、まず36種類の 正常組織を用いたRNA-seq解析のデータを入手し、起源細胞を推定する元データとした。この正常組織の解析は全てTCGA projectで用いられたものと同一の試薬 と解析パイプラインを用いて行っており、バイアスを生じることなくTCGAに登録されている33種類、11,315サンプルの悪性腫瘍に由来するRNA-seq解析データと 統合することができるようにした。現在は、当院病理科の協力の下で、未分化多型肉腫などの肉腫症例および多種多様ながん種の組織画像とRNA発現データを収集しており、画像と発現データの両方をインプットとした深層学習モデルの開発を行っている。十分な症例数が集まりしだい、未分化多型肉腫の再分類に関する深層学習モデルの作成と解析を行い、起源細胞に基づくシグニチャーと腫瘍特異的なシグニチャーを同定する。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
東京大学医学部附属病院では、独自に開発した東大オンコパネルを用いて各種腫瘍のクリニカルシーケンスを行っている。これは、過去に手術で採取した腫瘍の FFPEサンプルからDNAおよびRNAを抽出し、がん遺伝子/がん抑制遺伝子の変異解析・発現解析を行うものである。今回の研究は凍結検体を日本全国から収集して 行う予定であったが肉腫の希少性のため十分な検体数が収集できない恐れが出てきた。そこで、当院病理科と協力し、当院でこれまでに収集した多種多様ながん種・肉腫のFFPE検体の活用を試みた。東大オンコパネルによる発現解析とTCGAのRNA-seqによる発現解析を統合して深層学習モデルを構築するため、36種類の正常組織を東大オンコパネルと RNA-seqでそれぞれ発現量解析したデータを入手し、両者の変換式を導出した。このデータをキャリブレーションに用い、当院で保有しているFFPEサンプルの東大オンコパネルによる発現量解析をRNA-seqによる発現量に変換した。TCGAのデータのうち東大オンコパネルで採用されている遺伝子のみを用いたがん腫予測深層学習モデルでは96%以上の精度でがん種を予測できており、またがん種特異的に発現変動している遺伝子の抽出に成功した。さらにRNA発現データと対応する病理組織像の画像を使用し、発現データと画像の両方を使用した解析モデルを作成することで、診断精度の向上を図っている。
|
Strategy for Future Research Activity |
深層学習モデルは肉腫のデータだけで作成するのではなく、他の多様ながん種のデータも用いることで種々のバイアスが除外でき精度が向上する。これまでに収集した未分化多型肉腫の検体に加え、当院病理科から提供される種々のがん種の組織像と東大オンコパネルでの発現データを用いた解析を進める。RNA-seqおよび東大オンコパネルから得られるFASTQファイルを用いた発現量解析は、当研究室が保有している解析サーバーを用いて行う。深層学習モデルの開発に用いるGPUサーバーは 現在24ギガバイトのメモリを搭載したNVIDIA Titan RTXを用いているが、今後のサンプル数の増加に伴い必要メモリ量が増大する可能性があるため、TensorFlow を用いてGPUクラスターでの開発が可能になるようにモデルを調整していく。最終的に収集したデータを5-fold cross validationの手法で解析し、モデルの予測性能の妥当性検証を行う。
|
Causes of Carryover |
順調に研究が進んでいるが、必要以上に経費をかけずに済んだ。 次年度の経費のかさむ実験、解析等に使用する計画である。
|
-
-
-
-
-
[Journal Article] MicroSEC filters sequence errors for formalin-fixed and paraffin-embedded samples.2021
Author(s)
Ikegami M, Kohsaka S, Hirose T, Ueno T, Inoue S, Kanomata N, Yamauchi H, Mori T, Sekine S, Inamoto Y, Yatabe Y, Kobayashi H, Tanaka S, Mano H.
-
Journal Title
Commun Biol. Commun Biol.
Volume: 4
Pages: 1396
DOI
Peer Reviewed
-
[Journal Article] Scapular Angiomatoid Fibrous Histiocytoma with EWSR1-CREB1 Fusion in an Adult Patient.2021
Author(s)
Kobayashi H, Makise N, Shinozaki-Ushiku A, Ishibashi Y, Ikegami M, Kohsaka S, Ushiku T, Oda K, Miyagawa K, Aburatani H, Mano H, Tanaka S.
-
Journal Title
Case Rep Orthop.
Volume: -
Pages: -
DOI
Peer Reviewed
-
-
-