2016 Fiscal Year Annual Research Report
Three-dimensional data mining from protein molecular surfaces for discovery of knowledge about protein functions
Project/Area Number |
24300056
|
Research Institution | Kobe University |
Principal Investigator |
大川 剛直 神戸大学, システム情報学研究科, 教授 (30223738)
|
Project Period (FY) |
2012-04-01 – 2017-03-31
|
Keywords | 知識発見 / データマイニング / バイオインフォマティクス / 三次元データ / バイオデータ処理 |
Outline of Annual Research Achievements |
本研究では、タンパク質の機能に関連する知識の創出を目的として、分子表面データに対する三次元データマイニング技術の開発を進めた。平成28年度における主要な成果は以下の通りである。 1. タンパク質分子表面のグラフ表現に基づく機能部位発見の高速化:昨年度までに、タンパク質分子表面をグラフ表現し、特定のリガンドと結合するタンパク質群に顕著に観測される部分グラフを最適グラフとして発見する手法、ならびに類似頂点を集約して生成される抽象グラフの利用により、処理を高速化する手法について提案した。一方、抽象グラフの利用により、機能部位になる可能性が低い部分グラフまで探索対象とする問題が生じることが明らかになった。そこで、本年度は複数の抽象グラフを平均化した平均抽象グラフを新たに導入し、探索範囲を限定することで、さらなる計算コストの削減を可能とした。具体的には、抽象グラフの利用により、計算時間を約70%程度に抑えるとともに、平均抽象グラフの導入により、さらにその半分程度の計算時間による最適グラフ発見を達成した。 2. タンパク質分子表面の共通部分構造からの重要特徴点抽出:重要特徴点発見の対象であるクエリタンパク質と多数の参照タンパク質を空間上でマッチングすることにより、クエリタンパク質と各参照タンパク質における特徴点の対応関係を表したバイナリ行列を生成する手法を開発するとともに、得られたバイナリ行列に対するバイクラスタリング処理により、重要特徴点を抽出する手法を提案した。提案手法では、(1)列がタンパク質に対応することを考慮した列間類似度、(2)行が位置関係を持つ特徴点に対応することを考慮した行間類似度、および(3)同一参照タンパク質に対する複数のマッチング結果を含む列群からの排他的列選択の3つの概念を導入することにより、従来手法と比較して、高い精度で結合に関与する重要部位を抽出できることを実験的に確認した。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Causes of Carryover |
28年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
28年度が最終年度であるため、記入しない。
|