蛋白質立体構造はアナログ情報であるが、種々の情報処理的目的のためには、コード化してデジタル情報として扱えるようにすることが望ましい。コードの古典的な例としては、αヘリックスやβストランド等の2次構造がある。2次構造だけでなく、より詳細な主鎖や側鎖の構造、およびそれらが3次元構造中で接触する様子もコード化する。このコードは、それから立体構造が復元できるものであるように選ぶ。 コード化すべき立体構造の諸側面とアミノ酸配列との関係は、その空間的広がりによって異なっている。空間的広がりのある立体構造の特徴は、アミノ酸配列の詳細に敏感に依存しない。従って、構造の出現頻度から経験的評価関数を決める際に用いるべき立体構造のサンプルは、アミノ酸配列の相同性の高いものを除かなければならない。一方、空間的広がりの小さい立体構造の特徴は、アミノ酸配列の特徴に敏感に依存する。従って、そのような特徴に関する経験的評価関数構築のためには、アミノ酸配列の相同性の高いものを除く必要はない。以上の考察に基づき、サンプルとして用いるべきPDB中の立体構造の選び方を検討した。そのようにして選んだコードから、詳細な立体構造を再構築できるかを検証するための計算ソフトの整備も行なっている。 採用した詳細なコードをPBDのデータではなくリゾチームの立体構造のダイナミックス・シミュレーションの結果に適用している。これによってnative stateの構造の揺らぎの幅をコードによって表現できる。これはまた、アミノ酸配列がコードしている立体構造情報とは何かに関する解答を、操作しやすい形で与えるものである。
|