研究課題/領域番号 |
12208010
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
生物系
|
研究機関 | 京都大学 (2003-2004) 東京大学 (2001-2002) 理化学研究所 (2000) |
研究代表者 |
矢田 哲士 京都大学, 情報学研究科, 助教授 (10322728)
|
研究分担者 |
浅井 潔 東京大学, 新領域創成科学研究科, 教授 (30356357)
|
研究期間 (年度) |
2000 – 2004
|
研究課題ステータス |
完了 (2004年度)
|
配分額 *注記 |
72,400千円 (直接経費: 72,400千円)
2004年度: 20,000千円 (直接経費: 20,000千円)
2003年度: 20,000千円 (直接経費: 20,000千円)
2002年度: 15,400千円 (直接経費: 15,400千円)
2001年度: 17,000千円 (直接経費: 17,000千円)
|
キーワード | バイオインフォマティクス / 配列解析 / 遺伝子発見 / 確率モデル / 機械学習 / カーネル法 / ゲノム生物学 / 生物配列解析 / ゲノム / 統計推定 / 学習アルゴリズム / 認識アルゴリズム / データマイニング / ヒト / 遺伝子 / アノテーション / コンピュータ / アルゴリズム / ソフトウェア |
研究概要 |
ゲノム配列に観察される複雑な規則性を記述するための配列情報の表現モデルを考案し、そのモデルに立脚した配列情報のモデル化技術と学習/予測アルゴリズムの開発に取り組んだ。これらの基礎的研究の果を深化させ、タンパク質の遺伝子発見研究を中心とする応用研究を展開した。 矢田は、高度に汎化したHMMによる配列情報のモデル化と予測を行なうプログラムYEBISENを開発し、その特性を活かした2つの遺伝子発見モデルを設計した。ひとつは、複数の遺伝子発見プログラムを組み合わせて遺伝子を発見するモデル、もうひとつは、シンテニー領域のアラインメントにおけるギャップの入り方の違いを利用して遺伝子を発見するモデルである。これらは各々、遺伝子発見プログラムDIGITとPHINALにまとめられた。これらの単体性能が従来法を大きく上回ることを示したばかりでなく、両の併用がヒトゲノムの遺伝子発見を大きく実用に近づけることが確認された。 浅井は、BLAST相同性検索結果とab initio予測を組み合わせて、統合的に遺伝子発見を行なう遺伝子発見モデルと予測アルゴリズムを開発し、それらを遺伝子発見プログラムGeneDecoderにまとめた。GeneDecoderは、麹菌ゲノムのアノテーションプロジェクトで中心的な役割りを果した。また、配列情報の表現モデルの設計と配列の特徴量の抽出を独立に行うことのできる確率モデル上のカーネル法を提案し、この枠組みがタンパク質配列およびRNA配列の分類問題に効果的であることを示した。
|