細胞の複雑な機能には多数の遺伝子が関係している。そのため個体発生や環境変化に応じて細胞機能が変化するときには、多数の遺伝子の発現量が同調的に変化する。逆に多様な環境において発現プロファイルが類似している遺伝子群があれば、それらの遺伝子は共通の細胞機能を担っていると推定することができる。遺伝子共発現情報はこのような遺伝子発現の類似性であり、遺伝子機能を推定する方法として広く利用されている。特に公共リポジトリに蓄積している大量の遺伝子発現データを用いることで、網羅的で高精度な遺伝子機能推定が可能になる。しかし、公共リポジトリに蓄積している大量のサンプルには偏りがあり、データを適切に再構築しなければ、そのデータ量を十分に活かすことができない。本研究では、主成分分析を用いて遺伝子発現データを再構成することで、高精度の共発現情報を抽出できることを見出した。通常の遺伝子発現データに基づく共発現解析と比較して、提案手法である主成分スコアを用いた共発現解析では、ほぼ全てのパスウェイについて機能的に意味のある共発現関係をより効率的に抽出できていることが判明した。すなわち、再構成トランスクリプトームを用いた共発現解析では、特定の機能の検出能力が高まっているのではなく、細胞機能全般について正しく機能的関係を捉えることができる。さらに再構成サンプルにおける遺伝子共発現関係には典型的なパターンが存在することを見出し、それは遺伝子制御の複雑さを反映している可能性が出てきた。このことは本手法が遺伝子共発現関係だけでなく遺伝子制御関係の推定にも利用できることを示唆している。
|