2017 Fiscal Year Research-status Report
Development and Applications of Nonlinear Dimension Reduction with Weak Supervisiors
Project/Area Number |
17K08235
|
Research Institution | Osaka University |
Principal Investigator |
高木 達也 大阪大学, 薬学研究科, 教授 (80144517)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | FMO / PLS / IFIE / PIEDA |
Outline of Annual Research Achievements |
まず本年度は、Fragment Molecular Orbital (FMO)法により計算された、β-セクレターゼ、MDM2-阻害剤相互作用エネルギーによる生理活性値とIFIE(Inter-Fragment Interaction Energy)値による分子生物学的空間の間で、教師付き学習を行い、PIEDA(Pair Interaction Energy Decomposition Analysis)の値による分子生物学的空間も合わせた場合、相応の結果が得られることが示された。 まず、βセクレターゼとその阻害剤の相互作用エネルギーを、PDBに登録されている37種類の阻害剤との共結晶構造を基に計算した。計算された相互作用エネルギーと阻害活性との間には相応の相関性(R=0.639)が見られたが、満足できる数字ではなかった。そこで、IFIEの値を変数とし、PLSを行った。この際、IFIE絶対値の小さなもの(最大値と最小値の差が2.0kcal/mol未満のもの)を削除し、当初の378変数(残基)は279変数にまで少なくなった。このPLS解析の結果、2つの潜在変数でR=0.750まで改善された。 次にMDM2(Murine Double Minute 2)と阻害剤との間の相互作用エネルギーを計算し、同様に阻害活性値との比較を行った。こちらは当初から比較的良好な相関がみられた(R=0.824)が、85変数(残基)から絶対値の小さなものを削除することによって53変数(残基)とし、PLSを実行したところ、R=0.938まで改善された。更にPIEDA値の静電相互作用の項を変数に加えることによって、R=0.959に改善された。修正の大きかった(係数の大きかった)残基をグラフィックスで見てみると、想定通り、阻害剤の近くに多かったが、ループ、ランダムコイル構造の部分にも若干見られた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
教師付学習による確認はおおよそ完了し、次年度は、教師なし学習による化学空間と分子生物学的空間の融合を行う予定である。教師付学習による融合に関しては、既に国際学会でも発表し、次年度(30年度)も、第11回薬物の分子設計と開発に関する日中合同シンポジウム(2018年6月、紹興、中国)で発表予定である。この間、まだ予備的結果であるが、PLSで得られる潜在変数軸による教師なし(正確には弱教師付と呼ぶべきか;主成分分析による得点又は負荷マップに近い)分類でも、一定の成果を得ており、教師なし分類への拡張にも十分な期待が持てる状況にある。
|
Strategy for Future Research Activity |
当初、多様体分類を用いる予定であったが、データの性質上、必ずしも多様体分類を用いる必要性を見なかったため、多次元尺度構成法を使用する予定である。化学空間用の記述子は既にMoldredにより得られているため、化学空間と分子生物学的空間を構築する準備は、既にそれぞれ終えている。問題は、どの程度の弱学習器として、「相手方」の情報を取り込めば、期待通りの結果が得られるかであり、これは当初は、試行錯誤を繰り返すほかはないと思われる。期待通りの成果が得られれば、弱学習に関する指針も得られると考えている。実際、PLSで得られた潜在変数の値を用いた一種の主成分分析的マップでは、相応の分類結果が得られており、分子生物学的空間に関する限り、阻害剤の構造からの分類に対応しているため、当初の予定に近い結果が得られる可能性は高い。
|
Causes of Carryover |
おおよそ当初の予定通り進んでいるが、計算機を既設のもので賄えたため、少し余剰が生じた。この分は、次年度(30年度)に新たな計算機を購入することにより、より大規模な計算(多変数の多次元尺度構成法や多様体分類などの教師なし学習は、高速な計算機が必要になる)に適応させる予定である。
|
Research Products
(1 results)