研究課題/領域番号 |
26330250
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
加藤 博明 豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (30303704)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 分子構造情報処理 / モチーフ / タンパク質 / 遺伝子 / 分子生命情報学 / 縮約コドン表現 / 配列解析 / データベース |
研究実績の概要 |
生体高分子の構造データは分子進化や統御メカニズムの解明だけでなく、医農薬品開発の標的としても極めて重要である。遺伝子とタンパク質、すなわち、塩基配列とアミノ酸配列との関係はコドン表により定義されている。コドンとは、連続する三つの塩基(a, g, c, t の4種類から構成)のことであり、その組み合わせ(64種類)から20種類のアミノ酸が生合成される。本研究では、ワイルドカードを用いたコドン縮約表現を定義し、アミノ酸とコドンとの関係を1対1で表現した。例えば、アルギニン(R)に対応するコドンは6種類存在するが、これを 'cgn | agr' と表現できる。ここで、rはプリン塩基、nは任意の塩基にそれぞれ対応する。これらをもとに、与えられたアミノ酸配列に対応するコドン縮約配列(疑似配列)を生成する。 生成したコドン縮約配列をもとに、塩基配列データベースから対応するタンパク質のコーディング領域(遺伝子領域)の推定を行なう。ここでは、コドン縮約配列をクエリーとして、塩基配列データベースに対するホモロジー検索を行なう。コドン縮約表現を反映したアライメントスコアの定義を行なうとともに、ダイナミックプログラミング手法に基づくペアワイズ・ローカルアライメントを基礎とした検索プログラムの開発を行なった。既知のアミノ酸配列モチーフに注目し、機能部位の推定実験を試みた結果、途中にイントロン領域を含むような柔軟なパターンに対しても適用可能であることを確認した。また、モチーフ部分に注目したコドンの出現パターンについても調査を行ない、部位特異的な特徴パターンを得ることができた。 一方、制限酵素の認識部位として知られるDNAの回文構造に着想を得て、アミノ酸配列中の回文パターンを網羅的に集積し、その特徴解析を行った。その結果、コラーゲン構造などに特徴的に出現する新たなモチーフ候補を見出すことができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では、蓄積された大量の構造データベースを有効に活用し、構造-機能相関に関する知識獲得のための分子構造データマイニング手法の確立を目的とする。コドン縮約表現に基づく遺伝子領域の推定のための新たな方法を提案するとともに、モチーフと呼ばれる局所構造特徴に注目した遺伝子―タンパク質の配列、および対応する立体構造までを関連づけたモチーフ辞書(知識ベース)システムの構築を目指している。 本年度研究では、IUPACの1文字塩基コードによるワイルドカード表現を用いて、塩基配列とアミノ酸配列との関係を縮約コドン表現表として定義した。これにより与えられたアミノ酸配列に対応するコドン縮約配列(疑似配列)を生成するとともに、ダイナミックプログラミング手法に基づく、コーディング領域(遺伝子領域)の推定のためのプログラムの開発を行なった。既知のモチーフパターンを例とした計算機実験を試み、従来の方法では取り扱いが困難であった、途中にイントロン領域を含むような柔軟なパターンに対しても、その有用性・妥当性を示すことができた。また、モチーフ部分に注目したコドンの出現パターンについても調査を行ない、配列全体での使用率とは異なる、部位特異的な特徴パターンが存在することを見出した。 以上のことから、当初計画どおり、おおむね順調に進展していると考える。
|
今後の研究の推進方策 |
PROSITEデータベース中の正規表現で定義されているアミノ酸配列モチーフに対応する、コドン縮約表現を用いた遺伝子レベルのモチーフパターンを生成する。ここで、(1塩基単位ではなく)コドン単位の遺伝子モチーフを表現するため、正規表現の拡張を検討する。最新のGenBank塩基配列データベースから調整した実験用のmRNAおよびゲノム配列の代表データセットを作成するとともに、モチーフ部位に着目した遺伝子領域の推定と集積を試みる。配列モチーフに対する網羅的なモチーフ遺伝情報の探索実験を行ない、各モチーフを規定する遺伝子特徴の情報を集積する。これらの構造特徴は、これまでに得られた知見も用いながらそのサイズや出現頻度をもとに整理し、主要なものについては配列ホモロジー検索など既存のデータベース検索プログラムを用いて周辺環境も含めた調査を行なうとともに、その機能との関係についても検討を行なう。 一方、これまでに得られた結果をもとにして、遺伝子―タンパク質の配列、および対応する立体構造までを関連づけたモチーフ辞書(知識ベース)システムの構築を試みる。筆者らが先に作成した三次元モチーフ辞書の管理システムをもとに、分子グラフィックスによるモチーフ部位の探索結果表示など、ユーザインターフェースを含めたシステムの開発を行なう。コドン縮約表現のグループ間の類似度をもとにした階層的なパターン分類への応用についても併せて検討を進める。特に、配列全体で見たときのコドンの使用率と、局所配列特徴であるモチーフ部位に注目したときのものとの比較、およびモチーフに注目した生物種間の進化系統解析への応用についても検討したい。
|