2019 Fiscal Year Research-status Report
異質性混合効果をベースとした機械学習によるタンパク質ダイナミクス解析法の開発
Project/Area Number |
19K12203
|
Research Institution | Tottori University |
Principal Investigator |
網崎 孝志 鳥取大学, 医学部, 教授 (20231996)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 構造重ね合わせ / 混合効果モデル / クラスタリング / 分散共分散行列 |
Outline of Annual Research Achievements |
分子動力学シミュレーションにより得られるデータ(トラジェクトリ)の解析法に、特徴構造等の抽出に利用される構造クラスタリングやダイナミクス成分抽出のための主成分分析があるが、いずれも、デカルト座標データにおいては構造重ね合わせに関連する問題がある。本研究では、その影響を受けやすい従来の距離(RMSD)に基づくクラスタリング法の代わりに、異質性効果を含んだ混合効果モデルによりその問題点を解決することを第一の目標としている。 2019年度は、そのベースとなる混合効果モデルによるアンサンブル間・内変動を考慮した立体構造同時重ね合わせ法を再検討した。ここで、アンサンブルは、一定の条件で分類した立体構造の集合を意味している。 まず、アンサンブル間変動を表す変量効果を標準化し、その係数を推定する手法を、実際の分子動力学トラジェクトリに適用し、検討した。従来法(アンサンブル毎に重ね合わせ・平均化を行い、アンサンブル間変動を推定する方法)と比較した結果、変量効果モデル法は従来法に比し、アンサンブル間変動は比較的小さく、また、アンサンブル内変動は大きく推定する傾向がみられた。クラスタリングにおいては、アンサンブル(クラスター)間変動の大きさのほうがより重要であると思われるが、その推定においては、変量効果モデル法のほうが、概略、優れた結果を与えた。従来法では、アンサンブル内変動が大きい領域で、アンサンブル間変動の過大推定が顕著であった。この傾向は、アンサンブルサイズが小さいほど顕著であった。 その後、この変量効果モデルに加えて、クラスタリングへの適用がより有利と思われる、アンサンブル間変動を標準化しないような単純なVARCOMP型の立体構造変量効果モデルについても、その理論設計と実装を行った。今後は、まず、第一に、こちらの混合効果モデルをベースとしてクラスタリング法の開発を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画では、2020年度前半までに、構造クラスタリングの方法の設計と実装を行うことを想定していた。現時点で、そのベースとなる変量(混合)効果モデルの中でも、クラスタリングへの適用がより有利と思われる単純なVARCOMP型の立体構造変量効果モデルに基づく方法が実現できており、おおむね順調と思われる。
|
Strategy for Future Research Activity |
2019年度に作成した単純VARCOMP変量効果モデルを基にして、混合ガウスモデルに類似した形の分布型クラスタリング法を設計し、実装する。この変量効果モデルでも、パラメータ推定は、EMアルゴリズムと事後分布最大化法により行っているが、分布型クラスタリングの確率推定についても、同様に、この二つによる手法を用いる。なお、当初は、クラスタ間変動についての確率変数を標準化した(単純でない)VARCOMP変量効果モデルを予定していた。このモデルは、L1正則化による特徴的構造ズレの検出に好都合であるため、このモデルを使った分布型クラスタリングについても設計と実装を行う。 並行して、分子動力学シミュレーションを行い、有効性評価のためのトラジェクトリデータを用意する。サーモスタットを換えたトラジェクトリデータも作成し、分布の違いによる影響を調べる。対象とするタンパク質は、ヒトの酵素 hMTH1 とラットやゼブラフィッシュの MTH1 を予定している。
|
Causes of Carryover |
プログラム開発ならびに数値実験に利用するワークステーションは、クラスタリングの数値実験の際には多くのメモリが必要となるケースも予想されるが、大容量メモリは金額的に導入がむずかしかったことから、また、2019年度には、まだ、クラスタリングの数値実験を行わないことから、まず、プログラム開発用のマシンを導入することを優先した。このため、若干の余剰が生じた。この余剰金は翌年度に導入予定の計算サーバの調達に含め、長時間の全原子分子動力学シミュレーションのために、少しでも高性能(できれば高メモリ)のマシンを導入したい。
|
Research Products
(1 results)