2018 Fiscal Year Research-status Report
Project/Area Number |
17K00395
|
Research Institution | The University of Tokyo |
Principal Investigator |
平野 敏行 東京大学, 生産技術研究所, 助教 (60451887)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | タンパク質 / 波動関数 / データベース / 量子化学 / 電子状態 |
Outline of Annual Research Achievements |
タンパク質カノニカル分子軌道計算に必要な基盤技術は確立しつつありが、依然として難易度が高く、またその計算コストは非常に高い。本研究は貴重なタンパク質電子状態計算結果を蓄積・データベース化することを目的としている。膨大な数のタンパク質のカノニカル分子軌道計算を人手で行うことは現実的ではなく、ある程度自動化する必要がある。PDBに登録されているタンパク質構造から、アミノ酸のみで構成されるタンパク質だけでなく、リガンドや金属錯体などのヘテロ分子を含むタンパク質の、モデリングとカノニカル分子軌道計算を自動的に行う計算環境の研究開発を行った。 タンパク質のモデリングには、古典力場を採用している。ヘテロ分子を含むタンパク質に対するモデリングの対応を行った。アミノ酸残基と異なり、数多くあるヘテロ分子の力場パラメータは用意されていない。ヘテロ分子の力場パラメータを自動的に算出する仕組みを開発した。当初、オンデマンドに力場パラメータを算出する方法を採用していたが、大きなヘテロ分子が複数タンパク質で利用されている場合、再計算することになり、度重なる計算はリソースの無駄となる。現在、データベースに登録して再利用可能にするべく開発・計算している。 カノニカル分子軌道計算においてGPUを用いた計算の高速化を施した。SCF繰り返し計算中の行列計算をGPU上で行うことにより、計算時間を短縮することができた。本研究で開発したプログラムは、GPLライセンスのもとインターネット上に公開している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
QCLO法に基づく自動計算プログラムの開発・アップデートを行った。モデラープログラムの機能追加を行い、ヘテロ分子モデリングの強化を行った。タンパク質のカノニカル分子軌道計算を達成するためには、水素原子一つの過不足も許さないモデリングが求められる。タンパク質のほとんどは20種類のアミノ酸のペプチド結合により構成されているため、ヒスチジンや荷電アミノ酸などの一部アミノ酸残基を除いて、ペプチド鎖のモデリングはそれほど難しくない。一方で多種多様な物性をもたらすタンパク質には、ペプチド鎖の他にヘテロ分子を含むものが多い。ヘテロ分子は種類も豊富である。低分子の量子化学計算と同様に、タンパク質のモデリングも本来ならば量子化学計算により行われるべきである。しかし、量子化学計算の高い計算 コストゆえに現実的に実施困難である。そこで、もう少し計算コストのかからない古典力場でタンパク質のモデリングを代用した。とはいえ、ヘテロ分子のモデリングにも分子力場が必要である。一般的なアミノ酸残基は、種類も少なく、あらかじめよく研究された分子力場が用意されている一方で、ヘテロ分子は種類も多く、分子力場が用意されていない。本研究では、PDBに登録済みのヘテロ分子 に対し、自動的かつ網羅的に分子力場を計算する仕組みを構築し、自動計算を行った。現在、PDBに登録されているヘテロ分子辞書をベースに分子力場の作成を行っている。 カノニカル分子軌道計算のGPUを用いた高速化を行った。タンパク質のカノニカル分子軌道計算を行うに際し、計算時間の短縮はデータベースの構築において最も効果的である。分子軌道計算のボトルネックとなるSCF繰り返し計算において、複雑な分子積分を必要とせず、行列演算のみで計算が達成できる第3世代法を開発している。行列計算をGPU上で行うことで計算時間を短縮することに達成した。
|
Strategy for Future Research Activity |
タンパク質電子状態データベースとして登録・利用する仕組みに関する基盤研究を継続して行う。大量のカノニカル分子軌道計算をスムーズに行うために、特異的な構造でなければほぼ自動的にモデリングから自動カノニカル分子軌道計算を行うロボットプログラムを研究開発する。 モデリングプログラムとなるQCLObot_modelerの開発およびモデリング作業を行うにあたり、いくつかの課題が発生した。一つはモデリング自動化プログラムの高速化である。現在モデリングに際し、タンパク質まわりに水分子を顕に配置しているが、数が多いためにその処理に時間が割かれている。プログラムの並列化およびC++プログラム化によって高速化を図る。 二つ目は初期波動関数作成に利用するQCLO計算の高速化である。QCLO計算にはPipekとMezeyの局在化軌道計算を利用する。この計算アルゴリズムは軌道数の4乗に比例するため、大規模分子ではこれが律速段階になる。並列計算を利用して、短時間に局在化軌道計算を行う必要がある。 最後はQCLO計算シナリオの自動生成である。タンパク質の立体構造を考慮し、相互作用が大きな要素ほど初めの段階でQCLOフラグメントに取り込む必要がある。これまで、塩橋、二次構造、ジスルフィド結合などの特徴を確認し、計算の優先順位は人手で判断していた。計算シナリオの作成を自動化することは難しいが、機械学習などを利用して省力化を図りたい。
|
Causes of Carryover |
計算構造のモデリングプログラムの開発・デバッグ作業、およびモデリング作業の遅延により電子状態計算作業が遅延した。電子状態計算(カノニカル分子軌道計算)に必要な計算構造はモデリングしなければ得られないため、モデリング作業の遅延は電子状態計算の遅延につながる。カノニカル分子軌道計算には数万次元の大規模密行列計算が必要であり、これは数百GB単位のメモリに相当する。また計算を達成したデータを蓄積する記憶装置が必要であり、計算データ一つあたり数TBの記憶容量が必要である。次年度以降は電子状態計算に注力するため、記憶装置およびそれに付随する計算機の導入が必要であり、これを計画している。
|
Research Products
(8 results)