研究課題/領域番号 |
25460035
|
研究機関 | 大阪大学 |
研究代表者 |
高木 達也 大阪大学, 薬学研究科(研究院), 教授 (80144517)
|
研究分担者 |
川下 理日人 大阪大学, 薬学研究科(研究院), 助教 (00423111)
岡本 晃典 大阪大学, 薬学研究科(研究院), 研究員 (70437309)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 回帰分析 / 判別分析 / 正則化 / 偶然の相関 / 加水分解性予測 |
研究実績の概要 |
内閣府食品安全委員会における評価済み農業抄録、EPA Pesticide Reregistration、化学物質安全性評価シート、国際化学物質安全性カード、PRTR排出量等算出マニュアル5)およびその他文献情報6)から取得した、水中(pH=7)、温度20~25度において加水分解半減期が確認された143種の化合物を用いた。まず、OECDテストガイドライン111 を基に、データセット内の化合物143種について加水分解半減期に基づき、「安定」と「不安定」の2クラスに分類した。具体的には、加水分解半減期が1年より長いもしくは「安定である」と報告されている化合物69種を「安定」へ、半減期が1年以下の化合物74種を「不安定」へ分類した。そして目的変数として、「安定」へ分類されたものを0、「不安定」へ分類されたものを1に設定した。 3D記述子としては、対象となる化合物のCAS番号を基にThe PubChem Projectを用いて、化合物のSMILESを取得、フリーソフトウェアであるCinfony1.18を用いて、対象となる記述子の算出を行った。また、MMFF94力場を用いた三次元構造の構築およびエネルギーの最小化を行い、立体構造を最適化した。この段階ではともに1000回のステップを踏ませた。 これらの記述子を用い、L1正則化を行って、test setの正答率は、全化合物で72%、エステル、アミドと分類した場合、それぞれ85%、98%に達し、満足すべき結果を得た。この例では、L1正則化により偶然の相関が十分な程度除去できたと考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初予定していた主成分分析による正則化は、データ依存性が大きく、正則化できる場合とそうでない場合の差が激しかった。このため、主成分分析による一気の正則化は断念し、Lasso等、既存の正則化法と、新たな正則化法の組み合わせで偶然の相関を抑えることとし、一定の成功を収めることができたが、研究成果自体は、ほぼ追いつくことができたと考えている。当初の予定に比べ、検算が終了していないこと及び、論文化と研究発表ができていない点だけが遅れている。
|
今後の研究の推進方策 |
今年度は、現在までの成果を他のデータにより検算すると同時に、国際学会での発表と、論文化を行う予定である。データとしては、化学物質の環境毒性データを用いる。既に現在までの成果(加水分解生予測)をバルセロナで開催されるChemometrics in Analytical Chemistry (6月)で発表予定であり、検算終了後、論文化する予定である。
|
次年度使用額が生じた理由 |
当初予定していた主成分分析による正則化は、データ依存性が大きく、正則化できる場合とそうでない場合の差が激しかった。このため、主成分分析による一気の正則化は断念し、Lasso等、既存の正則化法と、新たな正則化法の組み合わせで偶然の相関を抑えることとし、一定の成功を収めることができたが、研究成果自体は、ほぼ追いつくことができたと考えている。当初の予定に比べ、検算が終了していないこと及び、論文化と研究発表ができていない点だけが遅れている。
|
次年度使用額の使用計画 |
本研究計画の成果は国内では反響が小さい(研究者の数が少ない)ため、昨年度、招待講演で発表した国際学会での発表を行う予定で、既に受理され、口頭発表が確定している。この国際学会への旅費と、論文化に伴う諸費用(英文校閲、投稿料など)に使用する予定である。
|