まず,蛋白質周辺の水分子の振る舞いを,仮想的な結合サイトを想定することにより,ガウス関数を用いた混合モデルによって特徴空間を構築し,その上でクラスタリングすることによって,水和水とバルク水を蛋白質表面からの距離を仮定すること無く同定した.次に,特徴空間上で詳細な解析を行い,複数の水分子の振る舞いによるクラスを同定した.さらにクラスに依存した時空相関関数等の解析によって,水和水に複雑な時空構造が存在することを示した. 以上の研究をうけて学習手法の改良を目指した.液体シリコンの第一原理計算データを対象に,教師有り/教師無し学習法を融合することにより,その各種の物理化学量に関して包括的でかつ高精度な予測が可能な新らしい機械学習の手法を開発した. 物理化学量をMD計算データからの原子周辺環境量から推定するためには,様々な予測・学習機能を用いることができる.その際,よく使われるのが線形モデルである.現実的な対象系には,幅広いパラメータの取得が必要である.しかしながら,線型モデルで数多くのパラメータを採用すると,モデルを複雑化する必要があり,モデル構築の手続きの煩雑さや予測精度の点で問題が生じる.研究代表者はこの問題を解決するために,データにおいて局所的な条件を満足するシンプルな線形モデルを複数構築し,つぎにその複数の線型モデルにガウス関数による混合分布をかけることにより,マトリックス上で結合する包括的なモデルを構築した.この定式化によって,多数のパラメータを採用しながら局所的な解をすべて満足する予測式を学習することに成功した. この手法により,液体の古典的な力場や物理化学パラメータを予測すると,従来のモデルよりも数倍精度の高い学習が可能となった.今後この手法を水の振る舞いに適用することにより,飛躍的に成果が得られることが期待できる.
|