2018 Fiscal Year Annual Research Report
A new scoring function for protein structure assment based on the hydration structure information.
Project/Area Number |
17K12780
|
Research Institution | Kitasato University |
Principal Investigator |
清田 泰臣 北里大学, 薬学部, 助教 (50631644)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | バイオインフォマティクス / タンパク質構造評価スコア / 3D-RISM理論 |
Outline of Annual Research Achievements |
前年度に作成したタンパク質表面情報-水和エネルギーを集積したデータベースは、SCOP2に登録された様々なタンパク質を基にしており、注目するアミノ酸残基の表面積の情報、周辺残基の情報、二次構造情報、そして3D-RISM理論により計算されたその残基の水和エネルギーの情報を、アミノ酸残基ごとに参照することのできるデータベースであった。このデータベースをデータセットとして、PythonのKerasライブラリを用いたディープラーニングによる分析を行った。ディープラーニングのバックエンドとしてTheanoを用い、「相関にのらない表面」での補正値に対する回帰式を、前述したデータセットから学習させた。これにより、3D-RISM理論により求まる、アミノ酸残基毎の「表面積-水和エネルギー」の関係を厳密に再現することに成功した。この関係式と、既存の高精度タンパク質構造評価スコアであるProQ3とを併用することで、モデリングされたタンパク質立体構造の精度予測の性能が向上するかを検証した。 対象にしたタンパク質群は2016年に開催されたタンパク質立体構造予測の国際コンテストであるCASP12および2018年に開催されたCASP13において提出された、様々な研究グループにより予測されたタンパク質立体構造モデル群である。検証の結果、実際の構造精度を示すスコアと予測した構造精度を示すスコアの相関が良くなり、性能向上が認められた。これにより、3D-RISM理論による水和エネルギーを考慮した新規構造スコアの開発に成功したと考える。 機械学習による構造スコアの精密化が済み、精度検証も行ったため、現在、論文として発表する準備を行っている。
|