研究概要 |
マイクロアレイ実験において,スライドガラスの傷やノイズ等を考慮して遺伝子発現量を推定するため,画素値強度以外のスポット特徴量と遺伝子発現量との対応表の作成および複製データによる発現量の確率分布推定を行った. 画素値強度以外の特徴量としてスポット内の強度分布の分散,歪度,および尖度を選定した.これら特徴量をマイクロアレイ画像から抽出するツールを作成し,RT-PCRから得られた遺伝子発現に関するデータと特徴量との対応表を作成した.また,遺伝子発現量をより正確に表すため,マイクロアレイの複製データを用いてノイズをモデル化し,遺伝子発現量を確率分布として推定した.本研究で用いたマイクロアレイは同一遺伝子を左右ブロックに複製して配置している.この複製データから散布図を作成するとノイズにより二次元的に分布する.そこで,分布の第一主成分軸上に真値が存在すると仮定し,各真値のノイズによる発生分布を二次元正規分布とみなして,全データの分布を複数の二次元正規分布で構成される混合分布によりモデル化した.モデルパラメータの推定にはEMアルゴリズムを用いた.イネ遺伝子の日周変動を調べるために同日中4時間ごとに葉から採取した4475個の遺伝子6セットによるマイクロアレイ実験データに対して提案法を適用し,遺伝子発現量を推定した.つぎに発現量確率分布の期待値をもとに遺伝子クラスタリングを行った.その結果,特定のクラスターに日周変動に関与する遺伝子が36個含まれていることを確認した.さらにどのクラスターにも属さなかった遺伝子に対して,発現量確率分布の両端5%を外した有意な発現範囲を用いて再度クラスタリングすることにより,このクラスターに19個の日周変動遺伝子が含まれた.今まではクラスタリングから欠落していたデータを候補として扱えるようになった.
|