植物組織別の遺伝子共発現ネットワークの構築と比較統合解析においては、小サンプルデータに基づく高精度遺伝子共発現情報の導出、ならびに遺伝子共発現の比較法が基盤的技術となる。「データ再現性」「ゲノム配列との無矛盾性」「遺伝子機能の同調性」の観点から遺伝子共発現の質を評価すると、遺伝子共発現情報は作成に用いるサンプル数に強く依存することがわかる。組織別の遺伝子発現データの選択においては、目的外の組織サンプルを除去しつつ、できるだけサンプル数を確保する必要があるため、サンプルの類似性に基づいた手動選択を補佐する仕組みを構築した。また、組織特異的共発現の比較を行うため、ブートストラップ法を用いて共発現指標の誤差分布を解析したところ、共発現の相互ランク指標をロジット変換すると、誤差分布はプラットフォーム特異的な標準偏差をもつ正規分布として近似できること、さらにバギング法を適用することで、特に小サンプルに基づく共発現の質を改善できることを見出した。一方で複数の遺伝子発現データの比較を容易にするバッチ補正法についても検討を行い、バッチ特有のランダム誤差を仮定した補正を行うことで、共発現の質を向上できることを見出した。これらの手法は植物の共発現データベースATTED-II(http://atted.jp)において公開されている全ての共発現プラットフォームの遺伝子発現データを用いて、本研究にて開発した単一組織レベルの共発現導出法の有効性を検証した。
|