2021 Fiscal Year Research-status Report
深層学習を用いた新規活性予測器の開発とHDAC阻害薬探索への応用
Project/Area Number |
21K15226
|
Research Institution | Osaka University |
Principal Investigator |
山下 泰信 大阪大学, 産業科学研究所, 助教 (10873408)
|
Project Period (FY) |
2021-04-01 – 2026-03-31
|
Keywords | 深層学習 / HDAC / AI / 創薬化学 / エピジェネティクス |
Outline of Annual Research Achievements |
計算機による薬物スクリーニングはコスト・時間を削減できる有効な創薬手法になる。既知の活性化合物を元にその類似化合物を予測するLigand-Based Drug Discovery (LBDD) 型の計算法は、標的タンパク質の構造を必要としない。本研究では、深層学習を活用し、汎用的に高い精度が得られる新規LBDD型の計算法の開発を目指した。現在主に用いられている記述氏を用いた手法では、どのような記述子表現が、高い予測精度を示すかは“熟練した研究者の豊富な経験と試行錯誤”に頼らざるを得なかった。さらに、これらの手法では分子全体を表すことが容易ではなく一部の情報が抜け落ちてしまう可能性がある。そこで、高い精度を汎用的に担保できる手法が求められており、本研究では、“研究者の主観”を排除し、構造式から記述子への変換プロセスを経由せずに化学構造自体を「入力」し、AI自身に化合物全体を学習させる深層学習を用いたLBDD法を開発する。 まず、化合物・生物活性データに関するデータベースであるChEMBLを用いて学習データセットを準備し、作成した活性予測期モデルに学習させた。テストデータセットに対する精度、AUC解析により、本活性予測期は、報告例のある既存のモデルよりも高い精度で化合物を予測できることがわかった。現在、さらなる予測精度の向上を目指している。さらに、学習データセットよりもはるかに多様性を有する、数十万化合物を有する化合物ライブラリーに対しても高い精度を有するか検討を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
学習データセットに対し、既存のモデルよりも高い精度を担保できる、深層学習モデルを作成できたため。
|
Strategy for Future Research Activity |
当初の計画通り、本モデルを化合物ライブラリーに適応し、新規骨格を有するエピジェネティクス制御薬を開発する。
|