研究分担者 |
長嶋 雲兵 独立行政法人産業技術総合研究所, 計算科学研究部門, 総括研究員 (90164417)
内丸 忠文 独立行政法人産業技術総合研究所, 計算科学研究部門, 主任研究員 (00151895)
都築 誠二 独立行政法人産業技術総合研究所, 計算科学研究部門, 主任研究員 (10357527)
松本 高利 東北大学, 多元物質科学研究所, 助手 (50343041)
中田 宗隆 東京農工大学, 大学院生物システム応用科学研究科, 教授 (40143367)
|
研究概要 |
本研究の目的は多数の化学物質についてニューラルネットワークを用い、化学構造の情報のみから発ガン性などの毒性を高い精度で予測する手法を開発することである。ニューラルネットワークが広範囲の化合物についてどの程度高い的中率で予測できるかを検討するために、3層構造のニューラルネットワークを用いて、Predictive Toxicology Challenge 2000-2001のコンテストで公開された他種類の有機化合物の発ガン性データを解析し、コンテストの参加者の結果と比較した。454種類の有機化合物について分子軌道計算から求まる37種類の記述子をニューラルネットワークに入力した。Error-back-propagation法によりニューラルネットワークを学習する際の過学習、over-fitting、局所解などの問題を解決するために、学習階数や中間層ユニット数などの条件を最適化した。モデルの作成に用いなかった化合物を用いて判別テストを行った結果、的中率73.7%の予測モデルを開発することができた。我々の方法は参加者のどれよりも高い予測的中率が得られたが、化学物質の毒性予測の実用目的からは決して十分な精度とはいえない.予測手法の開発に用いる発ガン性データについて発ガン性あり・なしの2値データではなく,発ガン性の強さに応じた連続性データを用いれば,既存手法より高い精度の予測手法を開発できる可能性がある.そこで次に発ガン性データベースの開発を行った。動物試験による発ガン性はIARC, EPA, NTP等様々な機関で収集評価しているので、各機関のランクを総合的に評価して,計9段階に格付けして発ガン性ランクデータベース(CRDB)を開発した.すなわち,発ガン陽性は最も信頼度の高いAランクから最も低いDランクまで4段階,陰性も最も信頼度の高いIランクから最も低いFランクまで4段階,及び陽性・陰性の判定不明のEランクの計9段階である.量子化学的記述を用いてこの発ガン性ランクデータをニューラルネットワークで解析した結果,平均誤差0.007,2乗相関係数0.999という高い精度で広範囲の化学物質の発ガン性を予測できることがわかった.
|