研究概要 |
今年度は,マイクロアレイ画像のスポット特徴量と遺伝子発現の有無との関連を解析するため,特徴量をマイクロアレイ画像から抽出するツールを作成し,スポットごとに各特徴量および発現有無を項目としたデータファイルを作成した.また,遺伝子発現量をより正確に表すため,マイクロアレイの複製データを用いてノイズをモデル化し,遺伝子発現量を確率分布として推定した. 本研究で用いたマイクロアレイは同一遺伝子を左右ブロックに複製して配置している.左ブロックの観測値と,対応する右ブロックの観測値からマイクロアレイ上の全遺伝子データの散布図を作成すると,複製データに関わらずノイズにより二次元的に分布する.そこで,分布の第一主成分軸上に真値が存在すると仮定し,各真値のノイズによる発生分布を二次元正規分布とみなして,全データの分布を複数の二次元正規分布で構成される混合分布によりモデル化した.モデルパラメータの推定にはEMアルゴリズムを用いた. イネの葉から採取した遺伝子4475個のマイクロアレイ6枚に対して提案法を適用し,遺伝子発現量を推定した.さらにマイクロアレイ間での発現量変化に基づき遺伝子機能を予測するため,発現量の確率分布を利用して遺伝子のクラスタリングを行った.中心点に集まったサンプルとそれ以外の遠方サンプルとの境界を探索するAdaptive quality-based clusteringの結果を利用して,クラスタリングの構成データではないが発現量の確率分布がクラスタリングに含まれる遺伝子を割合に応じてリストアップした.その結果,今まではクラスタリングから欠落していたデータを候補として扱えるようになった.
|