研究課題/領域番号 |
19K06624
|
研究機関 | 東北大学 |
研究代表者 |
大林 武 東北大学, 情報科学研究科, 准教授 (50397048)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 遺伝子共発現 / シングルセル / トランスクリプトーム / 遺伝子ネットワーク / データベース / バイオインフォマティクス / 生命情報科学 |
研究実績の概要 |
遺伝子共発現は多様なサンプル条件における遺伝子発現プロファイルの類似性であり、遺伝子機能推定に広く利用されている。一般にサンプル条件の多様性が高いほど、遺伝子機能を正確に反映する遺伝子共発現情報の抽出が可能だとされている。ここでサンプル条件の多様性の極限を考えると、ある生物種の全遺伝子の発現量(トランスクリプトーム)に影響を与える全ての環境となり、より具体的には、当該生物が存続する間の全ての個体環境とその環境における全ての細胞環境となる。この全環境におけるトランスクリプトームを当該生物種のリファレンストランスクリプトームと位置付け、このデータを適切に要約することで究極の遺伝子共発現情報を導出が可能になると考える。特に、多細胞生物では遺伝子発現の組織特異性が大きいため、組織ごとの正確なトランスクリプトーム、さらに細胞ごとのトランスクリプトームデータ(scRNAseq)が、リファレンストランスクリプトーム構築の鍵となる。 まず、実験条件の再構成を行うために、通常のトランスクリプトームデータ(bulk RNAseq)を大量に集め、実験バイアスの補正と、主成分分析によるサンプル次元圧縮を行ったところ、次元ごとに明確に異なる傾向の遺伝子機能が濃縮されることを見出した。この次元圧縮したデータから遺伝子共発現情報を導出すると、大方500次元で遺伝子機能推定力が飽和した。これは、最終的なリファレンストランスクリプトームにおける、組織を含めた環境の独立成分数は大方500程度であることを示唆している。同様の手法をscRNAseqデータに適用し、500次元のリファレンストランスクリプトームと、それに基づく遺伝子共発現データを構築した。その結果、scRNAseq共発現は、単独では性能が低いものの、従来型のRNAseq共発現と組み合わせることで、過去最高の性能を達成することができることを見出した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
実験条件の再構成に成功し、リファレンストランスクリプトームの鍵となるシングルセルRNAseqが遺伝子共発現に有効であることを実証した。さらに、実験条件再構成における、独立な環境の数は500程度であることを見出した。
|
今後の研究の推進方策 |
データは安定しているが細胞解像度の低いRNAseqと、細胞解像度は高いがノイズの多いscRNAseqの各々の特徴を活かすために、RNAseqとscRNAseqを同時に用いてサンプルの再構成を行う手法を開発する。また、組織の違いによるトランスクリプトームの多様性の観点から考えると、動物は植物よりも組織の多様性が高い。動植物の特性の違いにも注目しながら、データ解析手法の開発を進める。
|
次年度使用額が生じた理由 |
研究の進展が当初計画以上だったため、論文作成等の研究発表を促進するように前倒し請求を行なった。しかしその後の新型コロナウイルスの影響で研究会の現地開催が中止になるなどの予定変更があり、次年度使用額が生じた。
|