2021 Fiscal Year Research-status Report
Drug Design using Computational Chemistry and Multiple Supervised Machine Learning Systems based on Correlation between the Systems
Project/Area Number |
20K06987
|
Research Institution | Osaka University |
Principal Investigator |
高木 達也 大阪大学, 薬学研究科, 教授 (80144517)
|
Co-Investigator(Kenkyū-buntansha) |
田 雨時 大阪大学, 薬学研究科, 助教 (60761252)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | PLS / FMO / IFIE / 化学記述子 |
Outline of Annual Research Achievements |
FMO法では分子をフラグメントに分割して計算を行うが、この際フラグメント間の相互作用エネルギー(IFIE)を定量的に計算でき、創薬の情報源として重要な残基や相互作用の特定に用いられている。今回の研究ではIFIEと2D記述子双方のデータセットを用意し、二種のデータを同時に用いた活性予測を行った。 本研究のデータセットとして、Chk1(Checkpoint kinase 1)に結合するリガンド37個をサンプルとし、IFIE261種と2D記述子1177種を変数として用意した。これら二種のデータセットに、以下の処理を行った。 1.相関係数による変数削除。データセットに対する前処理として、説明変数同士の相関係数によって変数を削除した。削除の閾値は1.00から0.60まで0.02刻みで設定し、IFIEと2D記述子それぞれについて21個のデータセットを作成した。その後、各データセットから得られる活性予測精度を算出し、残っている変数の個数も勘案しつつ、この後の手順で用いるデータセットを決定した。 2.IFIEと2D記述子を同時に用いた活性予測。IFIEと2D記述子それぞれのデータセットから得た二つの予測値yest_IFIEとyest_2Dを基に、最終的な予測値を算出する計算モデルを作成し、その精度を単体データセットの時と比較した。最終的な計算モデルとしては、線形手法を一種、非線形手法を三種試した。y=f(IFIEi), y=g(X2d), y=αf(IFIEi)+βg(X2d)。ここで、f(ξ), g(ζ)は線形関数、α、βはyの予測を最適化する係数である。 以上の処理の結果、二つのデータセットから得られた予測値を線形重回帰によって合成することで、データセットを単体で用いたときよりも高い予測性能を得ることができた。本研究は創薬コストの削減や新たな構造展開に繋がると期待できる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
COVID-19パンデミックの状況下緊急事態宣言中などはミーティングやセミナーなども制限せざるを得ず、当初は変数選択に独自の手法(後述のシフト検定法)を導入する予定だったが、その準備は果たせたものの、未だ最終的な結果を得るには至っていない。また、中止や延期になる学会も多く、オンライン開催される場合でも研究室で一堂に会することが困難な状況では学会発表も困難な状況だったため、他研究者から意見を頂くことにも遅れが生じている。が、今年度は是非行いたいと考えている。
|
Strategy for Future Research Activity |
1.シフト検定による変数選択。手順1で決定したデータセットそれぞれに対して、シフト検定という独自の手法を用い、重要な変数の選択を行う。シフト検定法とは、準備された記述子のセットに対し、記述子と目的変数との対応をずらして、対応をデタラメにしてしまうことによって、どの程度相関性が低下するのかを見る手法である。Permutation 法に比べて、偶然対応ができてしまうことがないなど、より鋭敏な変数の重要度係数となり得ると考えている。この手法を用いて、IFIEと2D記述子それぞれから重要な変数を取り出し、どの残基が重要で、また、どの記述子が意味を持つのかを見ることができる。 2.PIEDAの採用。FMO計算では、残基間の相互作用エネルギーIFIEだけでなく、IFIEのエネルギー成分(静電、分極、電荷移動、分散相互作用)も計算可能であり、FMO法が遠方の静電相互作用を過大評価する嫌いがある事も念頭に、通常、PIEDA(Pair Interaction Energy Decomposition Analysis)計算も行っている。このPIEDAの値も、生物空間中の記述子として採用可能であり、導入によって相関性の改善が図れるかどうか、検討する。
この両者の実行の準備は完了している。シフト検定法のプログラミングは終了しており、PIEDAの値は、全Chk1阻害剤に対して得ている。後は実行のみであるので、シフト検定法に関しては間違いなく重要度の結果を得ることができるはずで、PIEDAに対しても、有効かどうかは判定できるはずである。
|
Causes of Carryover |
COVID-19パンデミックの状況下、大学院生はテレワークが主体となる時期も少なくなく、計算機関連の備品、消耗品などの購入自体が抑えられたため、物品費の為に予算を必要とする場面が殆どなかった。その上に、学会も中止、延期が多く、開催されてもオンラインであるため、旅費の必要性が殆どなく、全体として支出予算がゼロとなった。今年度は学会も無事開催される予定であり、研究代表者の研究環境の変化に伴い、物品費も必要となる予定であるため、昨年度分が丁度よく消費対象になると思われる。
|
Research Products
(3 results)