2003 Fiscal Year Annual Research Report
情報表現モデルによるゲノム配列情報のモデル化と予測
Project/Area Number |
12208010
|
Research Institution | Kyoto University |
Principal Investigator |
矢田 哲士 京都大学, 情報学研究科, 助教授 (10322728)
|
Co-Investigator(Kenkyū-buntansha) |
浅井 潔 東京大学, 新領域創成科学研究科, 教授 (30356357)
|
Keywords | バイオインフォマティクス / 配列解析 / 確率モデル / カーネル法 |
Research Abstract |
これまでの研究成果によって、具体的な研究目標のひとつである実用レベルの信頼性をもつヒト遺伝子発見プログラムの開発に成功した。まず、複数のab initio遺伝子発見プログラムを組み合わせて遺伝子を発見する遺伝子発見プログラムDIGIT、新しい指標を導入したゲノム比較による遺伝子発見プログラムPhinalは、従来法を上回る予測精度を示すことが検証された。これらのプログラムについて特筆すべきことは、これらのプログラムが同じソースコードYEBISENで実現されていることである。YEBISENは、ゲノム配列に観察されるさまざまな規則性をモデル化・予測する枠組みを提供している。さらに、多重出力HMMによる真核生物遺伝子発見システムGeneDecoderは、従来主に手作業で行われていたBLAST検索結果、EST貼り付け結果とabinitio遺伝子予測の統合化を自動的に行うことを可能にした。 さらに、配列情報解析の新しい展開を目指し、配列情報の多面性に光を当てた情報表現モデルに関する研究に着手した。例えば構造RNA配列の場合、その配列情報の実体は、複雑に絡みあった遠距離相互作用の総体であるが、それらが全体としてどのような構造を保持しているかは全く明らかにされていない。全体構造における遠距離相互作用を適切に表現できる確率モデルを設計することは困難であるが、確率モデル上のカーネル法を用いることにより、未知の構造情報を柔軟に取り込んだモデル化が可能である。すなわち、確率モデル上に適切なカーネルを設定することによって、比較的単純な確率モデルを用意するだけで、複雑な構造情報を何らかの形で表現したモデルを用意することに成功した。
|
-
[Publications] K.Ohshima, M.Hattori, T.Yada, T.Gojobori, Y.Sakaki, N.Okada: "Whole-genome screening indicates a possible burst of formation of processed pseudogenes and Alu repeats by particular Li subfamilies in ancestral primates"Genome Biol. 4. R74 (2003)
-
[Publications] T.Ota, Y.Suzuki, T.Nishikawa, et al.: "Complete sequencing and characterization of 21,243 full-length humancDNAs"Nat.Genet.. 36. 40-45 (2004)
-
[Publications] K.Tsuda, S.Uda, T.Kin, K.Asai: "Minimizing the Cross Validation Error to Mix Kernel Matrices of Heterogeneous Biological Data"Neural Processing Letters. 19. 63-72 (2004)
-
[Publications] T.Kato, K.Tsuda, K.Tomii, K Asai: "Maximum likelihood superposition of protein structures"Genome Informatics. 14. 488-489 (2003)
-
[Publications] M.Suwa, T.Sato, I.Okouch, M.Arita, S.Matsumoto, S.Tsutsumi, H.Aburatani, K.Asai, Y.Akiyama: "SEVENS : The Comprehensive Collection of Seven Transmembrane Helix Receptors, hunted from Human genome"Nucreic Acid Research. 31. 1 Online summary paper (2003)
-
[Publications] K.Tsuda, S.Akaho, K.Asai: "The em algorithm for kernel matrix completion with auxiliary data"Journal of Machine Learning Research. 4. 67-81 (2003)