2018 Fiscal Year Research-status Report
網羅的塩基配列解読データを用いたコンタミネーションの検出と影響解析手法の開発
Project/Area Number |
17K00396
|
Research Institution | The University of Tokyo |
Principal Investigator |
朴 聖俊 東京大学, 医科学研究所, 特任講師 (40759411)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | コンタミネーション / バイオインフォマティクス / 次世代シークエンシング |
Outline of Annual Research Achievements |
本研究では、本来の解析対象であるホスト生物以外に、バクテリア、ウイルスなどの微生物が実験サンプルに混入していないか、つまり、コンタミを次世代シークエンシングデータを用いて高確度に同定する方法の開発を目指している。これは、PCR法などの核酸増幅法では不十分な実験方法と環境等の適切さの評価とコンタミによる実験結果の誤解釈予防に資するものであり、様々な細胞実験を日常的に行う現代生物学研究に欠かせないツールとなる。
本年度では、これまでに構築・評価してきた解析パイプラインと複合非負値行列因子分解(Joint NMF)とを融合し、その解析結果からコンタミの機能的影響を推定する方法を開発し、実装した。すなわち、コンタミプロファイルと遺伝子発現プロファイルをJoint NMFに入力し、適切なパラメータ設定を行うための実験を繰り返した。その結果、コンタミ存在下で異常発現する遺伝子群を抽出することができた。この遺伝子群を用いたネットワーク解析とGene Ontology解析から、コンタミによる細胞のフェノタイプ変化を推定することができた。例えば、NCBI のGSE49321はMycoplasma感染DG-75細胞でRNA-seqが行われた例として知られているが、本手法によってDG-75はTumor Necrosis Factor ReceptorやHumanin-like proteinといったアポトーシス阻害関連遺伝子がMycoplasmaを含む多微生物混入と相関して異常発現していることがわかった。本開発手法をウェブツールとしてOpenContami(https://openlooper.hgc.jp/opencontami/)に実装し、学会などで研究結果報告を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
複合非負値行列因子分解(Joint NMF)の初期実装は昨年度末までに終了しており、修正を重ねながら論文発表準備を進めている。ウェブツールの改良も試みており、一般ユーザーに使ってもらうための準備も整っている。しかし、Joint NMFのパラメータ設定の難しさがボトルネックなり、様々な条件でのテストが欠かせなかった。この手法ではコンタミを含まない条件での本来あるべき遺伝子発現プロファイルが推定できないがために、教師なし深層学習手法などの導入を計画していたが、直感的に使いやすい Joint NMFアルゴリズム評価のためにやや遅れている状況である。
|
Strategy for Future Research Activity |
研究最終年度では、実践的に使いやすいコンタミプロファイル法の確立を目指すとともに、オンラインツールのブラシュアップにも努めたい。そのうえ、深層学習の導入と評価を試みる。また、論文発表、国内外での研究報告を積極的に行いたい。
|
Causes of Carryover |
論文投稿が遅れているため、英文校正の予算に差が生じた。 次年度に論文投稿準備費として使用する計画である。
|