2002 Fiscal Year Annual Research Report
時空間トランスクリプトーム解析に基づく転写制御ネットワークの推定
Project/Area Number |
14015223
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
石井 信 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (90294280)
|
Co-Investigator(Kenkyū-buntansha) |
金谷 重彦 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (90224584)
|
Keywords | トランスクリプトーム解析 / 転写制御因子 / 微生物 / 時系列クラスタリング / 多変量解析 / プロモータ配列解析 / 自己組織化写像 |
Research Abstract |
データが混合指数分布族をなしていると仮定した、統計的クラスタリング法を開発した。特にベイズ推定法を用いることにより、パラメータによる恣意性を極力排除した、客観性と安定性の高い解析法を開発した。アルゴリズムの主要部分について論文発表を行った。これを拡張したモデル(制約つきガウス混合モデル)を各種のDNAマイクロアレイデータに応用した。大腸癌に関連したヒトの遺伝子発現データに適用した結果、癌組織において特異的に発現量が変化する遺伝子群を抽出し、論文発表を行った。また、枯草菌の胞子形成培地における時系列データに適用して、特徴的な応答を示す遺伝子群を抽出し、それらと転写制御因子との関連を確認した。さらに、データに対して混合主成分分析を仮定することで、遺伝子発現量データに欠損がある場合に、従来の手法よりも大幅に高い性能で欠損値補完を行う手法を開発し、特許出願を行った。現在、統計的時系列クラスタリング法、転写制御破壊条件での発現量データ、プロモータ配列解析の組合せにより、より精密な転写制御因子の予測法を開発中である。 一方で、転写発現プロファイルデータから自己組織化写像法により遺伝子クラスタリングを行い、各種発現量データにおける相関から転写単位を抽出し、さらに転写因子の結合部位の配列特異性を考慮するという一連の手続きを順次行う、ゲノム-トランスクリプトーム統合解析法を開発した。これにより、遺伝子群に対する転写制御因子を精度良く予測することができた。 以上のアルゴリズムの多くは、JAVA言語によるソフトウェア環境として開発しており、生物学者などに使ってもらえる形として順次公開してゆく予定である。
|
Research Products
(6 results)
-
[Publications] S.Muro, I.Takemasa, S.Oba, M.Monden, S.Ishii, K.Kato: "Identification of expressed genes linked to malignancy of human colorectal carcinoma by parametric clustering of quantitative expression data"Genome Biology. 4・R21. (2003)
-
[Publications] 大羽成征, 石井信, 佐藤雅昭: "変分法的ベイズ推定による混合主成分分析"電子情報通信学会論文誌. J85-DII・6. 1055-1065 (2002)
-
[Publications] S.Oba, S.Ishii, M.Sato: "On-line learning methods for Gaussian processes"IEICE Transactions on Information and Systems. E86-D・3. 650-654 (2003)
-
[Publications] T.Oshima, H.Aiba, Y.Masuda, S.Kanaya, M.Sugiura, B.Wanner, H.Mori, T.Mizuno: "Transcriptome analysis of all two-component regulatory system mutants of Escherichia coli K-12"Mol. Micorbiol.. 46. 281-291 (2002)
-
[Publications] K.Yamagishi, T.Oshima, Y.Masuda, T.Ara, S.Kanaya, H.Mori: "Conservation of translation initiation sites based on dinucleotide frequency and codon usage in Eschenichia coli K-12 (W3110)"DNA Res.. 9. 19-24 (2002)
-
[Publications] M.Kawano, S.Kanaya, T.Oshima, Y.Masuda, T.Ara, H.Mori: "Distribution of repetitive sequences on the leading and lagging strands of the Eschenichia coli genome"DNA Res.. 9. 1-10 (2002)