研究課題/領域番号 |
19310128
|
研究機関 | 独立行政法人産業技術総合研究所 |
研究代表者 |
HORTON Paul 独立行政法人産業技術総合研究所, 生命情報工学研究センター, 研究チーム長 (00371071)
|
研究分担者 |
堀本 勝久 独立行政法人産業技術総合研究所, 生物情報工学研究センター, 研究チーム長 (40238803)
油谷 幸代 独立行政法人産業技術総合研究所, 生物情報工学研究センター, 研究員 (10361627)
|
キーワード | 遺伝子発現 / プロモータ解析 / 組織特異性 / 遺伝子分類 / 転写制御 / 発生の制御 / 細胞学 / 確立モデル |
研究概要 |
本年度では解析する遺伝子発現データの選定と処理を中心に計画を遂行した。マイクロアレイの公開データベースGEO(www.ncbi.nlm.nih.gov/geo)を用い、マイクロアレイプラットフォームGPL96の登録データの内から50種類のヒト正常組織から計2000枚以上のサンプルをデータ解析の対象として選定した。GE0のデータは".soft"という形式で公開されている為、soft形式のファイルから遺伝子の発現値や他の遺伝子との相関などが計算できる処理プログラムを開発した。これに関連した、遺伝子発現プロファイルの類似検索ソフトウェアを誌上(Bioinfomatics)で発表を行った。そのほかに、発現データ選定を容易にする為に開発したツール「Hamster」を公開した(http://hamster.cbrc.jp)。2008年に論文発表する予定のHamsterは、遺伝子発現プロファイルの可視化とクラスタ化ができるウェブツールである。 遺伝子発現周辺分布確率モデル学習に必要なプログラムの初期版を完成させた。具体的には、GEOデータをR言語に読み込み、Expectation-Maximizationを利用し、発現データからΓ分布の混合確率モデルを学習させることができるプログラムを開発した。更に、確率モデルの尤度とパラメータ数を考慮したBayes情報基準と赤池情報基準に基づいた、混合モデル成分数の選択も計算できる段階まで進んだ。クラスタ構造の可視化の為に、(既存のフリーソフトウェアを利用した)発現データのSelf Organizing Map計算スクリプトも開発した。 データ処理以外には計画後半に必要になる遺伝子特徴付けについて、遺伝子産物の細胞内局在予測法の改良を行い、Nucleic Acids Research誌で論文発表した。また、混合確率モデル成分数クラスごとのプロモータ解析に必要となるヌクレオソーム予測についての文献調査報告をまとめ、ファルマシア誌で発表を行った。
|