研究実績の概要 |
本年度はマルチオミクスデータの統合解析の足がかりとして、DNAシーケンサーを利用したRNA二次構造解析に対して、再現性やバッチエフェクトの問題を解決し統合的に解析するためのアルゴリズムの開発と、また時系列トランスクリプトーム・プロテオームデータの実データの解析を行った。 RNAの二次構造をゲノムワイドに決定するための技術のうち、ハイスループット構造解析と呼ばれる網羅性の高い実験手法があるが、膨大なデータが多様な条件下において生み出されており異なるプラットフォーム上で解析をせざるを得なかった。そのような強い不均一性を持つハイスループット構造解析データに対して、正解構造と再現性を基準に二次構造を決定するためのアルゴリズムreactIDRの開発を行った。reactIDRにおいては、教師付き学習によるパラメータ最適化によって、不均一な実験データからも再現性の高い結論のみを抽出することを可能にし、現在論文投稿中である。 次に、時系列トランスクリプトーム・プロテオームデータを統合的に解析するためのプラットフォーム開発を行った。共同研究者らによって得られたCAGE-Seq, RNA-Seq, プロテオーム, およびメタボロームの情報から、異なるオミクス層間で遺伝子の発現変動の比較を行ったところ大幅な再現性の低下が見られたが、一方で、パスウェイやオントロジーレベルでの解析を行うと、複数のオミクス層において共通で見られるものが存在することがわかった。さらにCAGE-Seqに対してMARA解析を適用することで、転写因子のアクティビティの変動と、転写因子を介したパスウェイ全体の発現変動を検出することに成功した。これらの結果から複数のオミクス層における発現データから直接エンリッチメント解析を行うための新規アルゴリズムの開発を行い、次年度以降その有効性を確認する予定である。
|