• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

コドン縮約表現に基づくタンパク質-遺伝子モチーフ辞書システムの開発

Research Project

Project/Area Number 26330250
Research InstitutionToyohashi University of Technology

Principal Investigator

加藤 博明  豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (30303704)

Project Period (FY) 2014-04-01 – 2017-03-31
Keywords分子構造情報処理 / モチーフ / タンパク質 / 遺伝子 / 分子生命情報学 / 縮約コドン表現 / 配列解析 / データベース
Outline of Annual Research Achievements

生体高分子の構造データは分子進化や統御メカニズムの解明だけでなく、医農薬品開発の標的としても極めて重要である。特にモチーフと呼ばれるタンパク質構造中に特定の配置で存在する局所構造特徴は、遺伝子またはゲノム配列の中でもよく保存されている部分であると考えられる。本年度研究では、コドン縮約表現を用いてアミノ酸配列モチーフに対応する遺伝子パターンを生成するとともに、これを用いたゲノム配列中の機能部位推定への応用を試みた。
コドン縮約表現とは、ワイルドカード(例えば、r(プリン)、y(ピリミジン)、n(任意塩基)など)を用いて、コドンとアミノ酸の関係を表現したものである。例えば、六つのコドンが対応するアミノ酸アルギニン(R)は二つの縮約コドン‘cgn|agr’で表現される。本年度研究ではさらに、Rを‘mgn’(ここで、m(アミノ)は‘a|c’に対応)と近似することにより、コドンとアミノ酸との関係を1対1として表した。ダイナミックプログラミング法に基づくモチーフ検索プログラムにおいて、長大なイントロン領域に対応するためギャップ伸張ペナルティを極小とし、コドン縮約表現へ対応するため置換行列の拡張を行なった。
NCBI RefSeqデータベースから抽出したヒト由来のゲノム塩基配列データセットに対して、GPCRの一種である匂い受容体に存在するモチーフを例として、タンパク質コーディング領域の推定実験を試みた。その結果、クエリーに完全に一致するモチーフ部位だけでなく、類似する部位も検出することができた。一方、カルシウム結合に関連するEF-handモチーフを例とした実験では、関連するエントリ中の複数の機能部位候補が検出された。これらの多くは既知のタンパク質コーディング領域に対応しており、エクソン-イントロン領域をまたがる形で保存されているものについても正しく検出できていることが確認できた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究では、蓄積された大量の構造データベースを有効に活用し、構造-機能相関に関する知識獲得のための分子構造データマイニング手法の確立を目的とする。コドン縮約表現に基づく遺伝子領域の推定のための新たな方法を提案するとともに、モチーフと呼ばれる局所構造特徴に注目した遺伝子-タンパク質の配列、および対応する立体構造までを関連づけたモチーフ辞書(知識ベース)システムの構築を目指している。
本年度研究では、前年度に定義したコドン縮約表現をさらに近似することにより、コドンとアミノ酸との関係を1対1として表現するとともに、タンパク質-遺伝子モチーフの重み行列とコドン縮約表現との対応付けを提案した。また、ゲノム配列中で、エクソン-イントロン領域をまたがる形で保存されているモチーフ領域に対応するため、ダイナミックプログラミング法に基づくアライメント手法を拡張した。既知のアミノ酸配列モチーフに対応する遺伝子モチーフ情報を生成・集積するとともに、グラフィカルユーザインターフェースを含めた、ゲノム配列の機能部位推定プログラムの開発を行なった。従来の正規表現パターンに基づく検索よりも、柔軟にモチーフ部位を検出できるように工夫した。計算機実験の結果より、複雑なエクソン-イントロン構造を含むゲノム配列の解析への足掛かりとして、モチーフコドン縮約表現によるゲノムの機能部位推定の有用性を示した。
以上のことから、当初計画どおり、おおむね順調に進展していると考える。

Strategy for Future Research Activity

これまでに得られた結果をもとにして、遺伝子―タンパク質の配列、および対応する立体構造までを関連づけたモチーフ辞書(知識ベース)システムの構築を試みる。筆者らが先に作成した三次元モチーフ辞書の管理システムをもとに、分子グラフィックスによるモチーフ部位の探索結果表示など、ユーザインターフェースを含めたシステムの開発を行なう。なお、データベース管理システムについては、従来のリレーショナルデータベース(RDB)だけではなく、より柔軟なドキュメント型のデータ構造を取り扱えるNoSQLの積極的な利用についても検討する。
モチーフの出現頻度や位置、コドン縮約表現のグループ間の類似度をもとにした階層的なパターン分類への応用についても併せて検討を進める。特に、配列全体で見たときのコドンの使用率と、局所配列特徴であるモチーフ部位に注目したときのものとの比較、およびモチーフに注目した生物種間の進化系統解析への応用についても検討したい。

Research Products

(3 results)

All 2015

All Presentation (3 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] Development of the protein-gene sequence motif analysis system based on the codon reduced representation2015

    • Author(s)
      H.Kato, and J.Yamamoto
    • Organizer
      2015 International Chemical Congress of Pacific Basin Societies
    • Place of Presentation
      Sheraton Waikiki (Hawaii, USA)
    • Year and Date
      2015-12-15 – 2015-12-20
    • Int'l Joint Research
  • [Presentation] Development of the structural feature analysis system based on the motif combination pattern of proteins2015

    • Author(s)
      S.Azuma, and H.Kato
    • Organizer
      Chem-Bio Informatics Society (CBI) Annual Meeting 2015
    • Place of Presentation
      タワーホール船堀(東京都江戸川区)
    • Year and Date
      2015-10-27 – 2015-10-29
  • [Presentation] Development of the DP-based genome sequence analysis system using the motif codon reduced representation2015

    • Author(s)
      T.Kobayashi, and H.Kato
    • Organizer
      第43回構造活性相関シンポジウム
    • Place of Presentation
      新潟日報メディアシップ(新潟県新潟市)
    • Year and Date
      2015-09-27 – 2015-09-29

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi