• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

Development of the protein-gene motif dictionary system based on the codon reduced representation

Research Project

Project/Area Number 26330250
Research InstitutionToyohashi University of Technology

Principal Investigator

加藤 博明  豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (30303704)

Project Period (FY) 2014-04-01 – 2017-03-31
Keywords分子構造情報処理 / 配列モチーフ / タンパク質 / 遺伝子 / コドン縮約表現 / コドン重み行列 / 三次元モチーフ / データベース
Outline of Annual Research Achievements

生体高分子の構造データは分子進化や統御メカニズムの解明だけでなく、医農薬品開発の標的としても極めて重要である。特にモチーフと呼ばれるタンパク質構造中に特定の配置で存在する局所構造特徴は、遺伝子またはゲノム配列の中でもよく保存されている部分であると考えられる。本年度研究では、タンパク質-遺伝子の配列、および対応する立体構造までを関連づけたモチーフ辞書(知識ベース)システムの構築を試みた。
NCBI RefSeqデータベースから7種類のモデル生物種ごとにタンパク質アミノ酸配列を抽出し、コドン縮約表現をもとにそのコーディング領域を推定し、対応データセットを生成した。次に、アミノ酸配列モチーフデータベースPROSITEの正規表現で定義された1,309パターンについて、モチーフの検索と集積を行なった。ヒトデータセット(約4万エントリ)の例では、907パターンについてその対応モチーフ部位が1件以上ヒットし、それぞれコドン重み行列の生成を行なった。これにより、例えば、Zinc-fingerではモチーフ中のシステインのコドン出現頻度において特徴的なパターンを見出すことができた。
NoSQL型ドキュメント指向データベース管理システムMongoDBのもとで知識ベースを構築した。さらに、PDBデータベースに立体構造が登録されているタンパク質について、その対応三次元モチーフ情報を集積・利用できるように工夫した。本システムを用いて、モチーフの共起関係に注目した特徴解析を試みた結果、例えば、zinc_proteaseとcysteine_switchモチーフの二つを内包するMMPタンパク質ファミリーについて、そのアミノ酸配列距離は106残基から295残基と幅があるのに対して、空間距離(モチーフ立体構造の重心座標間のユークリッド距離)はすべて約12Åと構造的に保存されていることを示すことができた。

Research Products

(4 results)

All 2016

All Presentation (4 results)

  • [Presentation] Development of the protein 3D fragment analysis system focused on ligand binding loop regions2016

    • Author(s)
      A.Hirama, and H.Kato
    • Organizer
      第44回構造活性相関シンポジウム
    • Place of Presentation
      京都大学芝蘭会館(京都府京都市)
    • Year and Date
      2016-11-16 – 2016-11-17
  • [Presentation] Development of the common fragment set extraction system for compound-protein relationship studies2016

    • Author(s)
      Y.Sato, and H.Kato
    • Organizer
      第44回構造活性相関シンポジウム
    • Place of Presentation
      京都大学芝蘭会館(京都府京都市)
    • Year and Date
      2016-11-16 – 2016-11-17
  • [Presentation] Development of the protein motif extraction system based on an Artificial Bee Colony algorithm2016

    • Author(s)
      T.Yamamoto, and H.Kato
    • Organizer
      Chem-Bio Informatics Society (CBI) Annual Meeting 2016
    • Place of Presentation
      タワーホール船堀(東京都江戸川区)
    • Year and Date
      2016-10-25 – 2016-10-27
  • [Presentation] Development of the protein-gene sequence motif extraction system based on EM algorithm2016

    • Author(s)
      T.Matsubara, and H.Kato
    • Organizer
      Informatics in Biology, Medicine and Pharmacology 2016
    • Place of Presentation
      東京国際交流館プラザ平成(東京都江東区)
    • Year and Date
      2016-09-29 – 2016-09-30

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi