研究実績の概要 |
本研究では、生物活性を示す低分子化合物の化学構造を生成するための統計的手法の開発を目的として進めた。必要な要素技術として、①低分子有機化合物の生成モデルの構築、②低分子化合物とタンパク質、双方の構造情報を基にした統計モデル、③能動学習とシミュレーションを用いて、自動的に予測モデルを更新するシステム構築がある。今年度は、主に①に注力した。特性から化学構造への予測モデルはInverse-QSPRと呼ばれ、これまで、あまり多くの研究成果は出ていない。本研究では、統計的言語モデルに基づく化学構造モデルを導入し、モンテカルロ法に基づく分子設計法を提案した.化学構造の表現にフラグメントを用いず、SMILES文字列の出現パターンについての統計モデルを構築、既存化合物のSMILES文字列の構成を事前学習することに新規性があり、多様な化合物らしい構造を短時間で生成することを可能とした。従来は、薬らしい化学構造は、人間の経験から得られた非常に多くのルールを基に判定されていたが、今回の研究で提案された手法を用いると、1000ほどのSMILES文字列から、薬らしさのルールを学習可能である。生体活性データに取り組む前段階として、内部エネルギーやバンドギャップといった、量子化学シミュレーションで高い精度で得ることができる物理特性を目標特性とし、その物理特性がある範囲に含まれる化学構造の生成を試みた。生成により得られた複数の化学構造に対して、再度、量子化学シミュレーションを実行すると、それらの多くが目標特性を持つことを確認できた。この結果は、論文にて投稿し、掲載されている(Ikebata et.al, Journal of Computer-Aided Molecular Design, 31(4), 379-391, 2017)。また、国内学会発表4報、国際学会発表1報にて研究報告を行った。
|