研究概要 |
H19年度は、東工大TSUBAMEスパコンシステム(11,664CPUコア,日本最大)上にドッキングソフトウェアおよび関連機能の整備を行い、約90×90の網羅的なドッキング計算などを実施した。ドッキング計算の中核部分には、これまで主に既存のZDockシステムを利用してきたが、本年度内にZDockとは無関係の独自のドッキングソフトウェアの開発が進み、TSUBAME上で稼働を開始した。独自ソフトウェアを使用した場合には、ドッキングにおいて独自の物理化学的評価関数を導入することができ、性能の向上が期待できる。 ドッキングの後処理では、候補サイトのタンパク質表面での分布を調べるために、ドッキングで発生する上位2000個程度の候補解に関して空間的なクラスタ解析を行っている。従来研究でも候補解の簡単なグループ化を試みた例はあるが、本研究では階層型・非階層型の6種類のクラスタリング法を本年度に実装し、網羅的なドッキング計算を通じてクラスタ化手法の差異を評価した。また候補解の間の「距離」を定義するには、平行移動の誤差と、回転の誤差を同列に扱う必要があるが、本研究では両者を統合するための新しいアイデアを提案した。 計算によって得られた解の「信頼度」の評価方式としては、上述の解析で得られたクラスタの大きさ(メンバー数)や、各クラスタのスコアの最大値など様々な基準を吟味して、クラスタリングをしない場合に比べて、正しい解を提示する感度と選択度が向上することを示した。 現状のタンパク質ドッキング計算の技術では、すべての問題に正解を与えることは困難であるが、高い確度でドッキングの候補を挙げられるケースと、エネルギー値は一見良い値を示しているが、他の視点から見て確度の高いドッキングとは言えないケースなどが計算結果の中に混在している。この両者をきちんと切り分けて提示することにより、利用者が実験へのフィードバックなどを的確に行うことを可能とすることが当研究が目指す目標である。
|