Drug Design using Computational Chemistry and Multiple Supervised Machine Learning Systems based on Correlation between the Systems
Project/Area Number |
20K06987
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 47020:Pharmaceutical analytical chemistry and physicochemistry-related
|
Research Institution | Osaka University |
Principal Investigator |
高木 達也 大阪大学, 大学院薬学研究科, 特任教授 (80144517)
|
Co-Investigator(Kenkyū-buntansha) |
田 雨時 大阪大学, 大学院薬学研究科, 助教 (60761252)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2020: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | シフト検定法 / FMO / IFIE / PLS / 化学記述子 / 部分最小二乗法 / PIEDA / 正準相関分析 / Machine Learning / Computational Chemistry / United Learning / Supervised Learning / Drug Design |
Outline of Research at the Start |
統計解析手法と機械学習法を理論化学へ応用する研究は、国内外で次第に広がりを見せており、例えば、W. Liらによる機械学習によって密度汎関数法(DFT)による相互作用エネルギー計算の輔弼を行う研究がある等、重要な研究成果も少なくない。 しかしながら多くは理論計算の補助的な使用であったり、力場の作成、量子化学計算の一部の代用等である。本研究計画では、SBDDを目的として、化学記述子とFMO計算によるIFIEの値を最初個別に使用して回帰を行い、次に両者を本格的に合体させることにより、一種の相関性を考慮した複合事前学習付き教師あり機械学習を実現、予測精度だけでなく、「中身の分かる」医薬品設計に資する。
|
Outline of Annual Research Achievements |
本年度の目標は、シフト検定という独自の手法を用いて、二つのデータセット(FMO計算から得られる残基-基質間相互作用エネルギー、IFIEと、基質の2D化学記述子)それぞれから有用な変数を抽出することにある。実際に取り出した変数について考察する中で、変数選択法としてのシフト検定の妥当性を示すことを目指す。 シフト検定法というのは、元来数理言語学で用いられたものを代表者が改良したもので、回帰の過程で記述子の対応をずらす手法で、対応がずれた記述子は本来回帰に重要な意味を持たなくなるため、もし当該記述子が重要であるならば回帰結果は大幅に悪化する筈である。逆に、悪化しない場合は、その記述子が重要でないことを示している。Permutation法の変形ともいえるが、Permutation法と異なるのは、偶然にも対応が取れてしまうケースが全く存在しないことと、遥かに短時間で結果が得られ、また、図示することにより結果が視覚化できることがあげられる。 本課題では、IFIEと2D記述子を同時に用いた活性予測法の検討と、シフト検定による変数選択を目指した。まず活性予測の面では、前処理を行った二つのデータセットからLWPLSを用いて独立に予測値を得て、それを線形重回帰に利用することで、単体データを用いるよりも高い予測性能を得ることができた。また変数選択においてはシフト検定という独自の手法を用いたが、IFIEでは実際の結合の様子と整合性のとれたものが選択され、2D記述子でもシャッフルの結果に関わらずほぼ同じものが選択されたことから、この手法の有用性を示すことができた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究成果そのものは全く順調に推移している。ただ、パンデミックの影響で、成果を学会で発表する機会が少なく、どうしても我流化している恐れを払拭できない。次年度はFIPや構造活性相関シンポジウムなどで積極的に成果発表を行い、種々意見交換をして更なる改良につなげたい。
|
Strategy for Future Research Activity |
シフト検定法によって、重要な記述子、残基の抽出は成功裏に終わったと考えている。 今後の方針は、IFIEという間接的にせよ生理活性値を表す空間(以下、生物空間)の情報と2D記述子という化学記述子空間(以下、化学空間)の情報を同時に、しかし互いにもう一方の空間から受ける影響を最小にしながら用いることで、pIC50の予測を行う新たな手法を検討することである。なおここで言う生物空間の情報とは、IFIEによって示されるタンパク質と基質の相互作用の情報を、2D記述子が示す化学空間の情報と対比的に表現したものである。過去にもこれら二種の情報のどちらかから活性予測を行う研究はあったが5、これらを同時に使う手法は希少である。この手法であれば、エントロピー変化に関わる情報を担う可能性がある化学記述子をIFIEと同時に用いることで、この問題を解決する効果が期待できる。 IFIEと2D記述子を用い、活性予測と変数選択を行うための新規手法を検討する本研究は、創薬コストの削減や新たな構造展開に繋がると考えられる。
|
Report
(3 results)
Research Products
(6 results)