研究課題/領域番号 |
20H00620
|
研究機関 | 東京工業大学 |
研究代表者 |
関嶋 政和 東京工業大学, 情報理工学院, 准教授 (80371053)
|
研究分担者 |
稲岡 健ダニエル 長崎大学, 熱帯医学研究所, 准教授 (10623803)
庄司 満 横浜薬科大学, 薬学部, 教授 (30339139)
平山 謙二 長崎大学, 熱帯医学研究所, 教授 (60189868)
樺島 祥介 東京大学, 大学院理学系研究科(理学部), 教授 (80260652)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | AI創薬 / 抗規制原虫薬 / 機械学習 / ロボット |
研究実績の概要 |
昨年度はシステムのうち、化合物生成モジュールを中心として機械学習による化合物の生成モジュールにおいて、薬候補化合物を仮想的に生成する手法の開発に取り組んだ。具体的には、蛋白質はアミノ酸が多数連結(重合)して出来た高分子化合物であるが、本手法では蛋白質を構成するアミノ酸配列を文字列として扱い、文章を固定長の分散表現に変換するdoc2vecの手法を用いて蛋白質を表現する。その後、分散表現化した既知の蛋白質と、この蛋白質に結合するdrug-likeな化合物をConditional VAEで学習する。新規の標的蛋白質については、Decoderに分散表現と乱数を入力とすることで、標的蛋白質向けに新規な化合物の生成を可能にした。 本研究で提案した物性予測付きCVAEでは標的タンパク質ごとに生成した化合物に対して、既に高い結合性を示している学習化合物との類似性の評価を行うことで、物性予測による拘束条件の能力の変化について確認を行った結果、標的タンパク質に対して生成した化合物は、約2割が該当標的タンパク質に対する学習用化合物と高い類似性を示しており、約9割に関しては該当標的タンパク質を含むサブファミリー内のどれかのタンパク質に該当する化合物と最も高い類似性を示した。また、望ましい物性を持つ化合物の生成として、QEDの値を対象としたベイズ最適化と勾配最適化を行い、化合物ライブラリーの拡張、また特定の物性値を持つ化合物ライブラリーの拡張手法としても適用の可能性を示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究実績の概要で述べたように、物性予測付きCVAEを実装し、標的タンパク質ごとに生成した化合物に対して、既に高い結合性を示している学習化合物との類似性の評価を行うことで、物性予測による拘束条件の能力の変化について確認を行っている。また、標的タンパク質に対して生成した化合物は、約2割が該当標的タンパク質に対する学習用化合物と高い類似性を示しており、約9割に関しては該当標的タンパク質を含むサブファミリー内のどれかのタンパク質に該当する化合物と最も高い類似性についても確認が出来ている。また、望ましい物性を持つ化合物の生成として、QEDの値を対象としたベイズ最適化と勾配最適化を行い、化合物ライブラリーの拡張、また特定の物性値を持つ化合物ライブラリーの拡張手法へも適用できる手法の実装が行えた。
|
今後の研究の推進方策 |
本年度はシステムのうち、深層強化学習による化合物最適化手法についてより実用的な合成可能な化合物を生成するための手法について研究を行っていく。特に、研究グループ内の合成学者と議論を行うことで、メディシナルケミストのHit-To-Leadの要望に添うことが可能となるシステムを目指している。その為、現在は精製時にQEDを評価関数として最適化することのみを行うシステムとしては一定の成果を得ているが、合成可能性なども考慮することを考えていく。現在、SMILESベースで行っているものを、グラフベースにした方が良いかも検討する。また、そのようなシステムを実際に抗寄生原虫治療薬に適用し、ケミストからの意見を反映していく。さらに、そのような深層強化学習により生成される化合物についてロボットでの合成可能性についても検討を行っていく。
|