2016 年度実績報告書

コドン縮約表現に基づくタンパク質－遺伝子モチーフ辞書システムの開発

研究課題

研究課題/領域番号	26330250
研究機関	豊橋技術科学大学
研究代表者	加藤博明豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (30303704)
研究期間 (年度)	2014-04-01 – 2017-03-31
キーワード	分子構造情報処理 / 配列モチーフ / タンパク質 / 遺伝子 / コドン縮約表現 / コドン重み行列 / 三次元モチーフ / データベース
研究実績の概要	生体高分子の構造データは分子進化や統御メカニズムの解明だけでなく、医農薬品開発の標的としても極めて重要である。特にモチーフと呼ばれるタンパク質構造中に特定の配置で存在する局所構造特徴は、遺伝子またはゲノム配列の中でもよく保存されている部分であると考えられる。本年度研究では、タンパク質－遺伝子の配列、および対応する立体構造までを関連づけたモチーフ辞書（知識ベース）システムの構築を試みた。 NCBI RefSeqデータベースから７種類のモデル生物種ごとにタンパク質アミノ酸配列を抽出し、コドン縮約表現をもとにそのコーディング領域を推定し、対応データセットを生成した。次に、アミノ酸配列モチーフデータベースPROSITEの正規表現で定義された1,309パターンについて、モチーフの検索と集積を行なった。ヒトデータセット（約４万エントリ）の例では、907パターンについてその対応モチーフ部位が１件以上ヒットし、それぞれコドン重み行列の生成を行なった。これにより、例えば、Zinc-fingerではモチーフ中のシステインのコドン出現頻度において特徴的なパターンを見出すことができた。 NoSQL型ドキュメント指向データベース管理システムMongoDBのもとで知識ベースを構築した。さらに、PDBデータベースに立体構造が登録されているタンパク質について、その対応三次元モチーフ情報を集積・利用できるように工夫した。本システムを用いて、モチーフの共起関係に注目した特徴解析を試みた結果、例えば、zinc_proteaseとcysteine_switchモチーフの二つを内包するMMPタンパク質ファミリーについて、そのアミノ酸配列距離は106残基から295残基と幅があるのに対して、空間距離（モチーフ立体構造の重心座標間のユークリッド距離）はすべて約12Åと構造的に保存されていることを示すことができた。

研究成果
(4件)

すべて 2016

すべて学会発表 (4件)

[学会発表] Development of the protein 3D fragment analysis system focused on ligand binding loop regions2016
- 著者名/発表者名
  A.Hirama, and H.Kato
- 学会等名
  第44回構造活性相関シンポジウム
- 発表場所
  京都大学芝蘭会館（京都府京都市）
- 年月日
  2016-11-16 – 2016-11-17
[学会発表] Development of the common fragment set extraction system for compound-protein relationship studies2016
- 著者名/発表者名
  Y.Sato, and H.Kato
- 学会等名
  第44回構造活性相関シンポジウム
- 発表場所
  京都大学芝蘭会館（京都府京都市）
- 年月日
  2016-11-16 – 2016-11-17
[学会発表] Development of the protein motif extraction system based on an Artificial Bee Colony algorithm2016
- 著者名/発表者名
  T.Yamamoto, and H.Kato
- 学会等名
  Chem-Bio Informatics Society (CBI) Annual Meeting 2016
- 発表場所
  タワーホール船堀（東京都江戸川区）
- 年月日
  2016-10-25 – 2016-10-27
[学会発表] Development of the protein-gene sequence motif extraction system based on EM algorithm2016
- 著者名/発表者名
  T.Matsubara, and H.Kato
- 学会等名
  Informatics in Biology, Medicine and Pharmacology 2016
- 発表場所
  東京国際交流館プラザ平成（東京都江東区）
- 年月日
  2016-09-29 – 2016-09-30

2016 年度 実績報告書

コドン縮約表現に基づくタンパク質－遺伝子モチーフ辞書システムの開発

研究代表者

加藤 博明 豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (30303704)

研究成果

[学会発表] Development of the protein 3D fragment analysis system focused on ligand binding loop regions2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Development of the common fragment set extraction system for compound-protein relationship studies2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Development of the protein motif extraction system based on an Artificial Bee Colony algorithm2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Development of the protein-gene sequence motif extraction system based on EM algorithm2016

著者名/発表者名

学会等名

発表場所

年月日

2016 年度実績報告書

加藤博明豊橋技術科学大学, 工学(系)研究科(研究院), 講師 (30303704)