2020 Fiscal Year Research-status Report
水素・プロトンまでを含む蛋白質原子モデルの量子化学計算による構築法の開発
Project/Area Number |
20K06503
|
Research Institution | The University of Tokyo |
Principal Investigator |
恒川 直樹 東京大学, 定量生命科学研究所, 特任研究員 (90638800)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 水素結合 / プロトン化 / 量子化学計算 / 膜蛋白質 / X線結晶解析 |
Outline of Annual Research Achievements |
本研究で開発している水素結合ネットワークの網羅的探索ツールは、ナトリウムポンプの膜領域イオン結合部位とその近傍のプロトンおよび水素原子の位置の決定を目的として開発されてきたが、更に、興味ある他の領域や異なる蛋白質分子に対しても適用できるよう、そのツールの汎用性を高めることが目標でもある。ソースコードのリファクタリングを兼ねて、C++での再構築を始めた。その際、X線結晶解析におけるデファクトスタンダードなツールパッケージのソースコードを調査し、それらを参考に、ツールの独立性を高め、汎用性と共に堅牢性を高め、高速化も念頭においた開発を進めてきた。 本ツールは量子化学計算を基盤にしたツールで、量子化学計算が実行できなければ結果は得られない。そこで、ナトリウムポンプ以外のプロトンポンプやカルシウムポンプも計算対象に含め、カルシウムポンプの4つの状態の膜領域イオン結合部位とその近傍について実行し、電子状態を得ることに成功した。その結果、簡易的ではあるが、それぞれの系についてのプロトンと水素原子の位置を決定できた。 適切な結果を得るためには、水素原子以外の原子の位置が正確でなければならない。残念ながら膜蛋白質のX線結晶解析は高分解能でも欠損原子や欠損アミノ酸残基が含まれる。X線結晶解析で得られる電子密度マップに何ら電子分布が得られないわけではない。そのような領域では電子密度マップと一致するような原子モデルを構築できなかったからである。そこで、分子動力学法(MD)シミュレーションによって、網羅的に原子モデル(コンフォメーション)を生成し、電子密度マップとの整合性を調査した。しかし、満足行くものは得られなかった。MDシミュレーションでは網羅的にコンフォメーションを探索できていない可能性があることが明らかとなった。そこで、網羅的にコンフォメーションを生成するツールの開発を始めた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本課題で提案した計画では、所属する研究室にあるクラスター型計算サーバに主にデータ保存のためのリソースを追加して、そこでの解析を想定したものであった。しかし、予算的に困難であると判断し、コンシューマ向けのPCや周辺機器で解析環境を構築し、両者を利用した解析を進めることにした。これを実現するために、取り扱うデータの精選を実行し、圧縮を図る。そして、データをよりシステマティックに保存する必要がある。このために、幾つかの既存のパッケージツール依存の解消や、シェルスクリプトやPythonスクリプトで作成されたツールのリファクタリングが必要となった次第である。その結果、想定していたリファクタリングより大掛かりなものになってしまった。 開発開始当初は、ツールのリファクタリングを、結晶解析のPythonライブラリーであるcctbxを基盤にして進めるつもりであった。しかし、後に述べる高速化のために、また、ユーザ親和性の点においても、ソースコードの独立性があるべきと判断し、C++で一から再構築することにした。結果、二度手間になってしまった。 コンシューマ向け計算リソースで解析を実行できるようにするために、ツールの高速化は必須となった。そこで、GPUを利用すべく、CUDAでの高速化を図ることにした。ベクトル化や並列化の開発経験はあるので、それほど悲観的ではないが、CUDAでの開発は経験がなく、習得のために想定外の時間を要している。 以上、進捗状況達成度の理由である。
|
Strategy for Future Research Activity |
ツールのリファクタリングは想定していたことなので、先に述べた進捗状況については悲観的には捉えていない。むしろ、蛋白質構造解析におけるユーザ親和性を鑑みると、コンシューマ向け計算リソースでの解析可能なツールの開発は望んでいたことでもあり、必要なことでもあった。cctbxなどのソースコード調査は、結果的に汎用的なツール開発にプラスになると考えている。また、本課題のような網羅的に探索を行うような解析では、GPUの利用は避けがたいことであろう。申請者が所属する研究室でもGPUの導入が為されており、ツールの開発の方向性と合致している。 CUDAでの開発には不安要素がある。リファクタリングにも開発工程の増加がある。課題達成を阻むこれらの障壁の解消のために、開発マネージメントの観点とそれを実現すべくツールの導入を行う。本課題では申請者単独での開発であるが、開発工程の精選やプライオリティを決定し、開発工程の圧縮を図る。 計算対象は、申請者が所属する研究室の研究状況により変化することがある。もちろん、この点は想定内であり、そのためのユーザ親和性や汎用性を高める開発でもある。現時点では、カルシウムポンプの膜領域イオン結合部位近傍の網羅的水素結合ネットワーク探索の実行や、ATP結合部位近傍への適用も目標としている。 課題達成に向けて、開発の方向性に問題はなく、ツールの開発工程のより厳選な管理によって、推進していく。
|
Causes of Carryover |
所属する既存の計算サーバにHDDやRAIDシステムなどを追加し、解析を遂行していく計画であったが、交付額では困難であると判断しました。代わりに、コンシューマ向けの計算機器で計算リソース環境を構築していく方針に変更しました。特に、当課題に必要とされるディスクを纏めて購入したことと、計算リソースの補填としてGPUを購入しました。当年度内に購入した理由はGPUなどの価格上昇の傾向があったからです。その結果、予定していた当年度の物品費の支出は増えました。そして、方針変更の為に解析ツールのリファクタリングの工程が重くなり、そちらに注力しました。そのため、成果発表は予定通りにはできなくなった次第です。よって、旅費やその他の予算の執行には至りませんでした。その結果、当年度の全支出は予定額とそれほど変わりはありません。 次年度は、これまでに構築した計算リソースで、計算能力的に不足することが生じた場合にそれを補填すべく部品の購入や修理等に、また、研究発表等の為の旅費などに予算を充てたいと存じます。
|