2020 Fiscal Year Research-status Report
異質性混合効果をベースとした機械学習によるタンパク質ダイナミクス解析法の開発
Project/Area Number |
19K12203
|
Research Institution | Tottori University |
Principal Investigator |
網崎 孝志 鳥取大学, 医学部, 教授 (20231996)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 構造重ね合わせ / 混合効果モデル / 分散共分散行列 |
Outline of Annual Research Achievements |
タンパク質ダイナミクスの解析に利用される構造クラスタリングや主成分分析は、デカルト座標においては構造重ね合わせに関連する問題がある。本研究では、その影響を受けやすい従来の距離(RMSD)に基づく方法の代わりに、混合効果モデルによりその問題点を解決することを第一の目標としている。 混合効果モデルは、アンサンブル間変動とアンサンブル内変動を区別する「階層性」に特徴がある。2019年度末に、混合効果モデルの一種であるVARCOMP型(分散要素)変量効果モデルを立体構造について適用した手法の開発・検討を開始したが、2020年度は、この手法の理論的検討およびコードの実装が、ほぼ実用レベルで利用できるところまで到達した。本手法の中心は、EMアルゴリズムとIRLS(反復重み調節最小二乗法)の組み合わせとして実現した。分散成分の推定や尤度の求値などの完成に時間を要し、クラスタリングや主成分分析への応用にまで着手できなかった。 現在、この分散要素型の立体構造変量効果モデルについて、数値実験による検証を行っている。比較対照としているのは、異分散性を考慮したIRLSによりそれぞれのアンサンブル内の平均構造を推定し、さらに、それらの総平均を求め、そこからアンサンブル間変動などを推定する「二段階法」である。これは、本手法を除き、現在のところ、もっとも信頼性の高い手法と考えられる。この比較による検証で最も注目されるのは、機能につながるダイナミクスを表していると考えられるアンサンブル間変動の分散の推定であるが、現在のところ、(従来のRMSDに基づく手法に比べて優れていると考えられる)異分散性を考慮する二段階法と比較しても、この分散の推定において、本手法が有利であることを示すデータが得られている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初の計画では、現時点では構造クラスタリングの方法を実現することを想定していたが、それに至っていない。 ただし、本研究の大きな目的は、タンパク質等の(機能に結びつく)ダイナミクスの解析のための優れた方法の実現であり、当初計画では、変量効果モデルによる分散共分散行列の推定とその主成分分析への応用を第二段階と考えていた。この点においては、昨年度末より検討を開始した VARCOMP型の立体構造変量効果モデルに基づく方法は、現時点の数値実験の結果から期待のもてる状況であり、一定の進捗があった。 以上から、上記の区分を選択した。
|
Strategy for Future Research Activity |
当初の計画では、立体構造に対する混合効果モデルあるいは変量効果モデルを整備した後は、それに基づき、まず、構造クラスタリング法を開発し、続いて主成分分析などの対象とするための正確な分散共分散行列の推定の検討にとりかかる予定であった。 2019年度末から作成し、検討を行ってきた分散要素(VARCOMP)型変量効果モデルは、アンサンブル数がアンサンブルサイズに対して大きいときに特に有用であることが一般的に考えられ、また、数値実験でもそれを支持する結果が得られている。ダイナミクスの解析という点では、この分散行列の検討のほうが優先されると判断している。そこで、2021年度は、分散要素型変量効果モデルの適用対象を具体化し、それぞれの場面での推定性能についての検証を行う予定である。 その際に、主成分分析の入力とするための異方性分散行列を、分散要素型変量効果モデルの出力から推定するための手法を開発し、その結果を検証する。現在使用している手法は、すべて、三次元空間において、分散の等方性を仮定しているためである。 以上の結果をできる限り早期にまとめて公表をしたい。 その後、可能であれば、分散要素型変量効果モデルをベースにした構造クラスタリングに着手したい。
|
Causes of Carryover |
2021年度は新型コロナウイルスの影響で、出張ができなかったことなどから、余剰が生じた。また、分子同力学計算用ワークステーションの導入でも、今後の作業量の点から想定を超えての購入は行わなかった。 次年度使用額と当該年度以降分として請求する助成金は、成果発表に利用するほか、保存・作業用ディスクの調達、また、現在、数値実験に時間を要しているので、最終年度の進捗を向上させるための数値実験用マシンの導入などを検討する。
|