2011 Fiscal Year Annual Research Report
近傍フラグメントスペクトル表現に基づくタンパク質構造データマイニングに関する研究
Project/Area Number |
22500130
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
加藤 博明 豊橋技術科学大学, 大学院・工学研究科, 講師 (30303704)
|
Keywords | 分子構造情報処理 / 三次元構造類似性 / タンパク質立体構造 / データマイニング / 分子生命情報学 / 分子グラフ / 構造活性相関 / 近傍フラグメント |
Research Abstract |
タンパク質の構造データは分子進化や統御メカニズムの解明だけでなく、医農薬品開発の標的としても極めて重要である。本年度研究では、筆者らが提案した近傍フラグメントスペクトル(NFS)表現をもとに、タンパク質の構造類似性評価への応用を試みた。最初に、有機低分子(分子グラフ)のトポロジカル距離(DT)(原子間の結合関係の情報)の考えを、タンパク質のアミノ酸配列に基づく距離に対応づけた。すなわち、注目するアミノ酸残基から前後m残基内の部分配列(ペプチドフラグメント)を切り出し、これをその注目残基の近傍フラグメント[DT=m]と定義した。例えば、グリシン残基を中心とする前後1残基からなるフラグメント1(トリプレット)は全部で400種類定義でき、与えられたアミノ酸配列中での、各トリプレットの有無の情報を400ビットのフィンガープリントとして記述し、これに基づく構造特徴探索を行なうことができた。 一方、三次元座標情報に基づくジオメトリカル距離(DG)の算出に際しては、与えられたタンパク質立体構造データから、構成アミノ酸残基をそれぞれひとつの仮想原子とみなし、対応するアルファ炭素の座標を用いて近似して表現した。これらの点の集合から、指定した距離の半径rÅの球内に位置するアミノ酸残基を探索し、近傍フラグメント[DG=r]と定義した。抽出された近傍フラグメントは、そのフラグメントサイズと頻度の情報に基づき多次元パターンベクトルとして表現した。類似度評価尺度として、従来のユークリッド距離のほか、Tanimoto係数なども利用できるよう工夫した。テストデータセットを例に検索実験を試みた結果、クエリーと同様の構造特徴を持つタンパク質を類似度上位に検索できたことを確認した。また、これら特徴空間における分子同士の関係ネットワークの系統樹表現を用いた可視化についても併せて検討を行なった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
生体高分子の機能解明を目指した構造データマイニングに不可欠な、分子の三次元構造特徴表現とそれに基づく構造類似性評価のためのアルゴリズムの確立と対応するシステムの開発を進めている。分子の立体構造特徴を記述するための新たな方法として、注目する原子の周辺環境に注目した三次元近傍フラグメントスペクトル(NFS)表現を提案した。さらに構造縮約表現に基づく、NFS表現のタンパク質構造特徴解析への適用を試み、その有用性・可能性を示した。以上のことから、当初計画どおり、おおむね順調に進展していると考える。
|
Strategy for Future Research Activity |
タンパク質四次構造(複合体)への適用に際しては、近傍原子(アミノ酸残基)の情報だけではなぐ、四次構造を構成しているサブユニシトの帰属情報を重み付ける。これにより、サブユニット間の会合領域など、構造的に重要な役割を果たしていると思われる部位の特徴を強調して表現することが可能になると考える。最新のPDB(Protein Data Bank)から調整した実験用データセットを作成するとともに、これらに対する網羅的な構造分類実験を行ない、各構造クラスを規定する三次元構造特徴(モチーフ候補)の情報を集積する。筆者らが先に作成した三次元モチーフ辞書の管理システムをもとに、得られた知見を集積・管理・利用するための知識ベースの構築についても併せて検討する。
|
Research Products
(1 results)