本研究は、デカルト座標系で表されたトラジェクトリデータ等から、タンパク質ダイナミクスや構造変動、構造異質性に関する情報を効果的に得るための手法の開発を目標としていた。その中心となるのが、分散共分散行列(以下、共分散行列)の推定であるが、当初は、その前処理として利用される構造クラスタリングとの統合や、特徴構造抽出のためのL1正則化の利用を計画していた。最終的には、この2点よりも、共分散行列の効率的推定に専念し、本研究の手法は混合効果モデルの一種の変量効果モデル(REM)に基づくものとなった。 それが対象とするのは、構造集団の集まりから成るデータである。REMは、集団間変動と集団内変動を区別して処理する方法で、集団間の違いを引き出すことができる。なお、ダイナミクスの解析は、デカルト座標系あるいは内部座標系で行われるが、本研究では、結果がより直観的に理解しやすい前者を採用している。そのためには、構造重ね合わせが必要になり、そのアーチファクトが危惧されるが、それの軽減の方策として、原子ごとの異分散性を考慮した手法とした。 2022年度は、異方性(方向依存性)についての検討を中心に行った。タンパク質の立体構造の重ね合わせには、Kabschの方法に類似の方法が広く使われるが、等方性の場合に限定される。単一集団だけを考えるのであれば、作業用分散には等方性のものを用い、重ね合わせが完了したあとで、異方性の、いわゆる標本分散共分散行列を求めることが通常行われる。本研究のREM手法でも、種々検討の結果、同様の考え方で進めた。ただし、作業用分散行列が3種類存在するために、専用の推定法を考案した。数値実験による検証の結果、二段階(TS)法と比べて、ほぼ同等の推定精度を示すこと、また、集団サイズの小さい例では、より正確な推定となる効果的な手法であることが確認できた。
|