2018 Fiscal Year Annual Research Report
Development of an integrated platform for analysis of epigenome and single-cell data
Project Area | Integrated analysis and regulation of cellular diversity |
Project/Area Number |
17H06331
|
Research Institution | The University of Tokyo |
Principal Investigator |
中戸 隆一郎 東京大学, 定量生命科学研究所, 助教 (60583044)
|
Project Period (FY) |
2017-06-30 – 2022-03-31
|
Keywords | バイオインフォマティクス / 1細胞解析 / 遺伝子ネットワーク / Data imputation / 情報基盤整備 |
Outline of Annual Research Achievements |
(1) 現在利用されている1細胞解析法においていまだ困難な、生体細胞・腫瘍内に少数のみ存在する細胞集団(生体幹細胞など)を同定するために、データ補完 (Data imputation) を利用したデータの高感度化について検討を進めている。10種の細胞種混合データ(PBMC)を用いた実験では、Data imputationによって細胞クラスタリングがより細分化され、希少な細胞集団を同定できることが確認された一方、得られる結果はimputationで与えるパラメータに強く依存し、解析の再現性に不安が残る結果となっており、今後更なる検証が必要である。当領域内の秋山班によって生成された卵巣がん組織細胞に対してこのData imputationを適用した結果、これまで得られなかった新たなサブクラスタが同定され、より詳細な細胞不均一性 (heterogeneity)を観測できた。得られたクラスタについて、秋山班による検証作業を行っている。 (2) 細胞クラスタ特異的な遺伝子群の共発現パターンを網羅的に同定するため、1細胞発現データを入力とした遺伝子共発現ネットワークの推定法を構築した。本手法では、あるData imputation法のために提案された遺伝子ペア間共発現類似度を示す指標であるco-dependency index (CDI)を遺伝子ネットワーク生成に応用した。大きな特長として、ハウスキーピング遺伝子などを除外し、真にクラスタ間で発現変動している部分遺伝子群(遺伝子モジュール)を同定できる。本手法を血清刺激を加えた膠芽腫幹細胞系の時系列データに適用し、共発現遺伝子ネットワークの時間変化を解析したところ、血清刺激依存的・非依存的な複数のモジュールが同定された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
(1) 遺伝子ネットワークから特に類似度の高い遺伝子モジュール抽出を行い、モジュール単位でのサンプル間比較を行うことで、サンプル特異的もしくはサンプル間共通のモジュールを同定することが可能となる。モジュール単位での比較は単一遺伝子の比較に比べて測定誤差に対して頑健であり、膠芽腫幹細胞の新規マーカや重要な細胞のクラスタにつながることが期待される。 (2) 公募班を含めて1細胞遺伝子発現データを生産しているグループが増加しており、それらのグループと共同で解析やディスカッションを行い、解析手法や得られた結果の解釈の方法について活発な議論を行っている。研究の発展著しい分野であるため、今後も他班と協力し合いながら世界の最先端の研究者に食らいついていく。 (3) 本領域の主要テーマの一つである「分野横断的な研究」を若手主体で推進することを目標に、日本分子生物学会年会(於横浜)において若手によるワークショップをオーガナイズした。第二回若手ワークショップ@仙台による口頭発表とともに、1細胞解析、画像解析、時系列数理モデリングなどの専門家が集合して活発な討論を行い、次世代シーケンサ解析及び1細胞解析手法について領域内の連携を深めている。
|
Strategy for Future Research Activity |
(1) 秋山班との共同研究による生体腫瘍細胞を用いた1細胞解析について結果をまとめ、論文として発表する。 (2) 1細胞解析を入力とした遺伝子ネットワーク推定と複数サンプル間でのネットワーク比較を用いた新規重要マーカ遺伝子群の同定手法について確立し、論文にまとめる。 (3) 続々発表される1細胞解析のための新規手法について引き続きサーベイを行うと共に、現時点で最良と思われる解析プロトコルを確立し、解析パイプラインとしてパッケージ化し領域内外に公開する。公開にはDockerによる仮想化環境を利用し、ウェブブラウザ型のパイプライン公開に比べて頑健性・柔軟性・拡張性が高く、任意の計算機上で同一の解析環境を提供できるよう努める。開発したパイプラインを領域内の1細胞解析をすすめているグループに対してテストを依頼し、フィードバックを受けながら更に改良を進めていく。 (4) 構築したDockerベースのパイプラインについて、ローカルの解析サーバへの導入及び、Google Cloud Platform(GCP)をはじめとする有償クラウドベースを用いた環境構築の両面について検討を進める。 (5) これまで注力していた1細胞RNA-seqから1細胞ATAC-seq, 多細胞RNA-seq、エピゲノム解析にまで対象を広げ、より多面的にサンプルを解析できる統合解析システムの開発について検討を進める。また、画像解析、数理モデリングの専門家とも連携し、次世代シーケンサ解析を超えた解析システムの開発を目指す。
|
Research Products
(3 results)