2011 Fiscal Year Research-status Report
グラフィカルモデルを用いた高分子ポテンシャルデコーダの開発
Project/Area Number |
23650068
|
Research Institution | Chiba University |
Principal Investigator |
篠崎 隆宏 千葉大学, 融合科学研究科(研究院), 助教 (80447903)
|
Co-Investigator(Kenkyū-buntansha) |
篠田 浩一 東京工業大学, 情報理工学(系)研究科, 准教授 (10343097)
関嶋 政和 東京工業大学, 学内共同利用施設等, 准教授 (80371053)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 3次元構造予測 / 高分子 / max-sum / サンプリング / 因子グラフ / 蛋白質 / ab initioモデリング / 三次構造 |
Research Abstract |
提案するSCMSアルゴリズムの開発・改良を行い、また並行してSCMSをポリペプチドの構造最適化に適用するためのソフトウエアの開発を行った。計算機実験をパソコンやサーバー、スーパーコンピュータTUBAMEを用いて行った。具体的には以下のとおりである。1、アスゴリズム開発・改良: 当初単純なマルコフ連鎖モンテカルロ(MCMC)法を用いたスライス内のサンプリングと分子内力のみに基づいたアルゴリズムについて検討を行った。その後、分子間力であるファンデルワールス力のモデル化や、アルゴリズム内でのMCMCサンプリング部およびmax-sum探索部への準ニュートン法の一種であるL-BFGS最適化法の導入などの拡張を行った。L-BFGS最適化法の導入では、スライス内のサンプリングやmax-sum探索における仮説展開方法についてのアルゴリズムの改良が合わせて必要となることが判明し、その対応を行った。これらの改良により、より大きな分散のプロポーザル分布の利用が可能になり、探索の効率が大幅に改善した。2、ソフトウエア実装: SCMSアルゴリズムでは高分子の立体構造を予測するが、その入力となる力場モデルは従来の分子動力学法と共通の物を用いる。このため、力場モデルの読込みに既存のソフトウエア(TINKER)をライブラリとして利用しつつ、提案する探索処理を独自にFORTRANで実装することで実現した。入力部にTINKERを利用することにより、開発を効率的に進め、また比較手法の実装も容易となった。また探索処理について、MPIを用いた並列化の拡張を行った。3、計算機実験: 最大で200残基のポリアラニンをターゲットとして、最適化実験を行い、提案法の有効性を確認した。実験の結果判明した問題点をアルゴリズム開発にフィードバックし、改良を行った。並列化により、高速化が可能なことを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
提案するSCMSアルゴリズムは、分子中の原子間の結合長や結合角等の物理的パラメタの総体である分子力場をグラフィカルモデルの一種である因子グラフとして表現し、さらにそれをmax-sum探索に適した別の因子グラフに変換することに基づいている。この変換は一般には計算量的に困難であるが、高分子を原子座標に基づき空間的にスライス分割し、そのスライスに基づき因子グラフの変換を効率的に行う点が、本提案手法の特徴である。初年度においては、まず分子内力のみを対象としてアルゴリズムを定式化し、ソフトウエアの実装と評価実験を行った。SCMS法ではスライス内においてサンプリングを行うが、ここでは単純なMCMC法を用いた。評価実験により、提案法の効果を確認した。その後、分子間力であるファンデルワールス力を組み込み、また既存の一般的な力場を利用できる形でソフトウエアをFORTRANにより再実装した。さらに、MCMCサンプリングにL-BFGS最適化を組み合わせる拡張を行った。しかし、ここで最適化を組み合わせた場合スライス内でのサンプリングおよびmax-sum探索の仮説展開に問題が生じることが計算機実験により判明した。そこで当初の役割分担に沿った形で分担研究者とともにアルゴリズムの改良およびソフトウエアの拡張に取り組み、実験とその結果に対する考察を繰り返すことで、探索性能を向上させることが出来た。研究成果について、研究会等で発表し、質疑応答などを通じて議論を深めた。またそれにより、今後の方針についてより具体的な構想を持つことが出来た。これまでの成果をまとめた論文を論文誌へ投稿し、採録された。以上のことから、本研究は当初の計画に沿ってアルゴリズムの開発とソフトウエアの実装を行い、また研究を進めることで判明した問題についても対応できていると言える。そのため、「概ね順調に進展している」と判断できる。
|
Strategy for Future Research Activity |
前年度はアルゴリズムの概念実証に重点を置いたが、今後はより実際的な高分子立体構造予測を行うためのアルゴリズムおよびソフトウエアの改良に取り組む。具体的には、静電相互作用や溶媒のモデル化、よりグローバル解に近い解を探索するための改良などが重要な課題として挙げられる。静電相互作用は作用距離が大きいため、単純なカットオフではSCMSが仮定するスライスの独立性を満たすことが難しい問題がある。そのためスライスの独立性を保ちながら、遠距離の影響を取り込むための工夫が必要となる。溶媒の取り扱いは自然界におけるタンパク分子の構造予測において必要となる。SCMSでは原子が一つの分子として連結していなくてはいけないというような制限はないため、原理的には現状のアルゴリズムで取り扱い可能である。しかし、単純な方法では対象となる原子数が大幅に増加するため、その取り扱いのためには計算量が膨大となることが問題である。同様の問題はSCMSに限ったことではなく、これまでに分子動力学法などを対象に溶媒を扱うための様々な手法が提案されている。それらは溶媒分子を明示的に扱うものから非明示的に扱うものまで多岐にわたる。SCMSにおいてどのように対応するのが適切かは、検討事項である。また、現状のSCMSにおいてMCMC法などと比較して大きな分子に対して効率的な探索が行えることは確認されたが、グローバルな最適解に近づくにはまだ探索能力が十分でなく、より効率的な探索を実現する必要がある。そのためには、スライス内での探索方法の改良の他、最適化の段階に応じた探索メタパラメタの制御、高分子に対するSCMS最適化の適用化方法の工夫などが考えられる。今後はこれらの何処に重点を置いて研究を進めるべきか先ず予備検討および実験を行い、それに基づき改良を進める予定である。
|
Expenditure Plans for the Next FY Research Funding |
次年度使用額が生じた理由は、データ整理に謝金を使用せず研究室内で対応できたこととともに、既存のPCやサーバを活用しながらソフトウエア開発作業が順調に進められたことなどによる。初年度はエネルギー極小値の探索のためのアルゴリズム的な観点に重点を置いて研究を進めたが、今後はより実際的な立体構造予測を目指しソフトウエアを改良し、また計算機実験の規模を拡大する。そのため、研究室の計算リソースを強化し、またスーパーコンピュータを利用するための支出を行う。SCMSでは、高分子を空間座標中でスライスし、各スライスに基づき原子をクラスタリングした因子グラフでモデル化を行う。そして連続量である原子座標をスライス毎にサンプリングし、max-sumアルゴリズムを適用する。この一連のプロセスにおいて大きな計算量を占めるのが、エネルギー計算が必要となる原子座標のサンプリングである。SCMSではそのサンプリングをスライス毎に独立して行える特徴があり、スライスを単位とした効果的な並列化が可能である。この原理を利用した実験を進めるためには、メニーコアの計算機環境が不可欠である。また、対象とする原子数の増加とともにより多くのメモリが必要となる。そのような計算機環境の整備や利用のため、初年度より繰り越した予算を合わせて利用することにより、大規模な計算機実験をより効率的に実行できると期待される。また、まとまった成果が得られた時点で逐次研究成果発表を行い、また情報収集を行うために、論文出版費や国内外の研究会参加費等の支出を予定する。
|
Research Products
(4 results)