2018 Fiscal Year Research-status Report
Development and Applications of Nonlinear Dimension Reduction with Weak Supervisiors
Project/Area Number |
17K08235
|
Research Institution | Osaka University |
Principal Investigator |
高木 達也 大阪大学, 薬学研究科, 教授 (80144517)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 多次元尺度法 / 多様体学習 / 化学空間 / 生物学空間 / FMO |
Outline of Annual Research Achievements |
2018年度は、PLS、MDSを用いて化学空間の情報による生物学データの修正として、以下のような内容の試みを行った。
1.Fragment Molecular Orbital(FMO)法を用いて、リガンド-蛋白質間相互作用の計算を行う。今回は、DPP4と阻害剤の相互作用を計算し、実測値と比較したが、計算値はそのままではほとんど実測値を再現できない。このため、PLSを用いて、IFIE(各アミノ酸残基とリガンドの相互作用値)毎に修正を行うことにより、相関係数の値にして0.303から0.917へと向上させることができた。 2.このリガンドの生物学的空間は、IFIEデータを用いたMDSにより大凡分離することができたが、まだ十分に、分子設計に役立つほどには分離し切れていない。また、残基のMDSでは、ほとんど有益な情報を得ることができなかった。従って、多様体分析の使用も念頭に置きつつ、化学空間を加味して、より「役に立つ」マップを描くのが今年度の目標である。 3.化学空間は既に、当研究室で開発された化学記述子発生ソフト、Moldredにより、1000種類以上の記述子を発生させ、その記述子そのものの分類も終えている。問題は、分類された記述子のうち、どれを代表記述子として使用するかであり、(1)標準化した値の平均値を用いる、(2)主成分分析を行い、その主成分得点を用いる、(3)因子分析(バリマックス回転)を行い、その因子得点を用いる。など、幾つか考えられるため、どの手順が最も適切か、検討する必要がある。現在、記述子の代表空間を選定中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
教師付き学習に関しては、化学空間と生物学空間を同時に用いたPLS法により、化学空間から生物学空間を良好に推測することが可能であることを示すことができた。PLS法の結果はまた、修正が必要と思われる電荷のあるアミノ酸残基の係数の絶対値が大きく、FMOが静電ポテンシャルを過大評価することと密接な関連性があることが想定された。
教師なし学習に関しても、生物学空間は、リガンドの構造種別による分離を一定程度示しており、これに化学空間の情報を加味することにより、より分子設計に役立つ情報を得ることができることが示唆された。
|
Strategy for Future Research Activity |
本年度は最後の仕上げで、すでに得られている生物学空間におけるMDSマップに、以下の様な修正を行う。 (1)MDSを多様体学習に変化させた場合の分離度の変化を探る。測地線距離は測地線の定義により、極値はMDSとなることから、測地線の定義を変化させれば、どの程度の定義で適切な分離度が得られるかがわかる。 (2)化学空間の情報を加味したMDS、多様体学習を行い、より分子設計に役立つ情報を入手できるマップの作成を行う。 (3)PLS等の教師付き学習により、IFIEからpI50の値を推測する場合、各アミノ酸残基のIFIEに対する重要性を示す係数が得られるため、この係数(標準化係数やその絶対値も考えられる)を用いた多次元空間を作成し、MDS、多様体学習を行うなどの手法が考えられる。同様に、化学記述子からpI50を推測する場合も同様で、PLSなどにより得られる(標準化)係数を用いた多次元空間上のマップを作成し、そのMDS、多様体学習により2次元マップを得、先のIFIEによる結果と統合するという手段が考えられる。現在この手法を最有力の技法の一つと考えており、まず最初に取り組みたい。
|
Causes of Carryover |
予定していたソフトウェアのアップデートがなかったために、物品費で少しの余剰が出たのと、予定していた人件費が必要なかった(フリーソフトウェアの発達で賄うことができた)が、他の部分は、おおむね予定通りの執行ができたと考えている。なお余剰しているのは主として初年度に余剰した分が積み残されているもので、これは最終年度に国際学会報告や論文の投稿などと、全体をまとめ上げるための視覚化ソフトウェアの購入などで使用される予定である。
|
Research Products
(2 results)