2008 Fiscal Year Annual Research Report
タンパク質コード領域に特微的な塩基配列パターンの網羅的な解析
Project/Area Number |
17310116
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
中村 保一 Kazusa DNA Research Institute, 植物ゲノム研究部・植物ゲノム情報研究室, 特別客員研究員 (60370920)
|
Keywords | タンパク質遺伝子コード領域 / 遺伝子発見 / 配列パターン解析 / コドン使用傾向 / ゲノム塩基配列解析 |
Research Abstract |
本研究は、既知の塩基配列が存在する全生物種について、網羅的にコード領域を判別・収集し、生物種あるいは生物分類群ごとにコード領域に特徴づける数塩基までの配列パターンのモデル化情報を集積することを目的として遂行している。同時に、その解析情報を利用することで、遺伝子コード領域推定、すなわち、ゲノムや転写産物由来の塩基配列からタンパク質遺伝子である可能性の高い領域とフレームの推測を幅広い生物種で可能とするべく、応用に向けた方法論の検討もあわせてすすめている。平成20年度は前年度までに実施した、生物種ごとのコード領域を特徴づける配列パターンの収集ならびにモデル化をさらに推進していくとともに、その有用性を評価し公開するための研究を推進した。 1.既知の塩基配列からの生物種ごとの網羅的なコード領域の集積 コード領域配列パターン解析の基盤情報となる塩基配列情報の選抜と集積を継続し進めた。 2.コード領域を特徴づける数塩基までの配列パターンの収集・モデル化 平成17-19年度の研究結果をふまえ、網羅的に収集したコード領域塩基配列から、生物種あるいは生物種群ごとに特徴的な配列パターンの確率モデルを作成する作業を継続するとともに、ネガティブデータからの特徴抽出とモデル化を試みた。 3.生物種ごとのモデルの評価統合ならびに解析環境の作成 生物種ごとに遺伝子コード領域を特徴づけたモデルを用い、主要な生物種について未知の塩基配列からのコード領域推定を行うシステムの制作を試みた。
|