研究実績の概要 |
最終年度は、主として今までに得られた結果の検算と、実データへの応用、及びそれらの国際学会での発表を行った。Elastic Netとしての検算結果は良好であり、そのシステムは、化学物質の加水分解速度の判別に応用され、良好な結果を得た。ここでは、143データ(易分解性69、難分解性74)に対し、当初86化学記述子+フロンティア軌道指数2の計88の記述子を用いて、Elastic正則化に基づくロジスティック回帰を行った。この結果、全化合物を対象にした場合、L1正則化のみの場合、交差検証法(CV)基準では69%、BIC基準では69%(以下、順序は同様)、L1正則化後L2正則化を行った場合は78%、84%、の正判別率を得ることができた。Ester類のみを対象にした場合は、L1正則化のみの場合、83%、89%、L1正則化(Lassoロジスティック回帰)後L2正則化(リッジロジスティック回帰)を行った場合は、89%、89%とやはり、L2正則化が正判別率に大きな意味を持つことが示された。残念ながら、Elastic Netでは当初予測したような結果は得られなかったが、上記の値からはそう大きく下回っていないため、今後、パラメーターの調整などによって、当初の予測通りの結果を得る可能性は残されている。 この結果は、"Logistic Regression Analysis for Predicting Hydrolysability using Regularization Techniques, というタイトルで、"5th International Conference on Biometrics & Biostatistics, Houston, USA Oct.20-21, 2016, USAにて発表された。
|