2014 Fiscal Year Annual Research Report
機械学習に基づく新しい創薬インフォマティクス-医薬品化合物の分子設計
Project/Area Number |
25540015
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
吉田 亮 統計数理研究所, モデリング研究系, 准教授 (70401263)
|
Co-Investigator(Kenkyū-buntansha) |
伊庭 幸人 統計数理研究所, モデリング研究系, 教授 (30213200)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 化学情報学 / 創薬 / 分子設計 / ベイズ統計 / カーネル法 / マルコフ連鎖モンテカルロ法 |
Outline of Annual Research Achievements |
本研究の目的は、機械学習に基づく有機化合物の分子設計法の開発である。薬剤分子の設計を主な対象とした。薬の設計では、約10^60個の候補化合物が対象となる。この広大な化学空間から、薬に必要な性質を有する化学構造を発掘することが目的である。開発手法の構成は、以下の通りである:(1)化学構造の特徴記述子として、新規グラフカーネル(原子環境カーネル)を考案し、実験データを用いて、構造から性質(薬理活性、毒性など)を予測するフォーワードモデルを構築する。(2)フォーワードモデルをベイズ則にしたがい反転させ、性質から構造のバックワード予測(事後分布)を導く。マルコフ連鎖モンテカルロ法で事後分布から化学構造をサンプリングし、所望の性質を有する埋蔵分子を発掘する。本研究では、薬の性質に関連する12種類のデータセットを用いて、原子環境カーネルに基づき12種類のフォーワード予測モデルを開発した。さらに、薬らしさを規定する約600のルール(事前分布)を組み合わせ、フォーワードモデル(尤度)を反転させて、事後分布を導いた。最後に、マルコフ連鎖モンテカルロ法で事後分布から化合物グラフのランダムサンプリングを行った。サンプリングでは、既存化合物から約四百万個のフラグメントを切り出し、これらを構造改変用の部品とし、化合物グラフのマルコフ連鎖を生成する(フラグメントアセンブリ法と呼ぶ)。数値実験では、フラグメントアセンブリ法で複数の化合物の中間体を生成することに成功し、医薬品開発における開発手法の潜在的有用性を示すに至った。研究成果の一部については、Journal of Chemical Information and Modeling誌にて論文を発表している。
|
Research Products
(2 results)