2019 Fiscal Year Research-status Report
Development and Applications of Nonlinear Dimension Reduction with Weak Supervisiors
Project/Area Number |
17K08235
|
Research Institution | Osaka University |
Principal Investigator |
高木 達也 大阪大学, 薬学研究科, 教授 (80144517)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 多様体学習 / 多次元尺度構成法 / 部分最小二乗法 / 交差有効性検証法 / フラグメント分子軌道法 / SBDD / QSAR |
Outline of Annual Research Achievements |
昨年度まで、最も単純な多様体学習である多次元尺度構成法を用いてきたが、今年度は、本格的に多様体学習を用いて多元的非線形相関次元圧縮を行った。 多様体学習は高次元のユークリッド空間の中でデータが低次元の多様体の周囲に分布しているとして、その多様体構造を利用し、非線形に次元圧縮する方法で、しばしば「スイスロール」のケースが例に挙げられるが、このisomapだけでなく、LLE(Locally Linear Embedding)を、今回は使用した。 データ例としては、当研究室でFMO(Fragment Molecular Orbital)法により計算された、BACE1(βセクレターゼ1)とその阻害剤の残基―リガンド間相互作用情報(IFIE)と、阻害剤の化学記述子を用いた。化学記述子はRdkit2019.03.1.0及びMOE2019.3により、2次元及び3次元記述子1396を発生させ、有効なもの651を得た。 これらの記述子の中から、PLS回帰により、pIC50を表すのに重要な記述子及びIFIEを選択、これらの(広義の)記述子に重みをかけて結合、多様体学習を行った。結果として得られたMapで、リガンドの2次元座標分布とpIC50の関係性を評価し、多様体学習の結果の2次元座標が改善するように更に変数を選択した。 結果として、IFIEによる場合も化学記述子による場合も、MDS、Isomapに比べて、LLEを用いた時、最もpIC50が良好に対応するMapを得ることができた。IFIEデータによる場合は当然と考えることもできるが、化学記述子による解析で、重要な結果が得られたことは特筆に値する。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
重要な結果は全て得ることができ、本来、年度末の国際学会、国内学会で発表の上、論文化する予定であった。しかし、ご承知の様に、COVID-19パンデミックにより、軒並み予定していた学会(薬学会年会、サンフランシスコ;シンガポールは他の理由)が中止、延期になり、その分だけ最後のまとめが遅れている。
|
Strategy for Future Research Activity |
当初の予定していた結果は全て得られたため、このプロジェクト自体は概ね終了( 最終的な検証が残っているが)し、延期、中止で遅れている学会発表と論文化に注力する予定である。このため、1年間の延長を申請した。
|
Causes of Carryover |
先述のように、年度末に発表を予定していた学会(国内・国際)が延期、若しくは中止となったため、次年度に発表、発表が困難な場合は、先に論文化して、Webページによる公開を予定している。このため、次年度に予算が必要となった。
|
Remarks |
年度末に発表後、Webで公開予定であったが、本年度は、学会がCOVID-19の影響(1件、他の理由のものがあります)で、軒並み中止になりましたため、全体の成果発表が遅れています。
|
Research Products
(1 results)