研究課題
本研究の目的は、機械学習に基づく有機化合物の分子設計法の開発である。薬剤分子の設計を主な対象とした。薬の設計では、約10^60個の候補化合物が対象となる。この広大な化学空間から、薬に必要な性質を有する化学構造を発掘することが目的である。開発手法の構成は、以下の通りである:(1)化学構造の特徴記述子として、新規グラフカーネル(原子環境カーネル)を考案し、実験データを用いて、構造から性質(薬理活性、毒性など)を予測するフォーワードモデルを構築する。(2)フォーワードモデルをベイズ則にしたがい反転させ、性質から構造のバックワード予測(事後分布)を導く。マルコフ連鎖モンテカルロ法で事後分布から化学構造をサンプリングし、所望の性質を有する埋蔵分子を発掘する。本研究では、薬の性質に関連する12種類のデータセットを用いて、原子環境カーネルに基づき12種類のフォーワード予測モデルを開発した。さらに、薬らしさを規定する約600のルール(事前分布)を組み合わせ、フォーワードモデル(尤度)を反転させて、事後分布を導いた。最後に、マルコフ連鎖モンテカルロ法で事後分布から化合物グラフのランダムサンプリングを行った。サンプリングでは、既存化合物から約四百万個のフラグメントを切り出し、これらを構造改変用の部品とし、化合物グラフのマルコフ連鎖を生成する(フラグメントアセンブリ法と呼ぶ)。数値実験では、フラグメントアセンブリ法で複数の化合物の中間体を生成することに成功し、医薬品開発における開発手法の潜在的有用性を示すに至った。研究成果の一部については、Journal of Chemical Information and Modeling誌にて論文を発表している。
すべて 2015 2014
すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (1件) (うち招待講演 1件)
Journal of Chemical Information and Modeling
巻: 54 ページ: 1289–1300
doi:10.1021/ci400403w