研究分担者 |
長嶋 雲兵 独立行政法人産業技術総合研究所, 計算科学研究部門, 総括研究員 (90164417)
内丸 忠文 独立行政法人産業技術総合研究所, 計算科学研究部門, 主任研究員 (00151895)
都築 誠二 独立行政法人産業技術総合研究所, 計算科学研究部門, 主任研究員 (10357527)
松本 高利 東北大学, 多元物質科学研究所, 助手 (50343041)
中田 宗隆 東京農工大学, 大学院・生物システム応用科学研究科, 教授 (40143367)
|
研究概要 |
本研究の目的は多数の化学物質についてニューラルネットワークを用い、化学構造の情報のみから発ガン性などの毒性を高い精度で予測する手法を開発することである。我々はニューラルネットワークが広範囲の化合物についてどの程度高い的中率で予測できるかを検討するために,PTC2000-2001のコンテストのデータを解析し,コンテストの参加者の結果と比較した。我々の方法は参加者のどれよりも高い予測的中率が得られたが,その的中率は74%程度であり,化学物質の毒性予測の実用目的からは決して十分な精度といえない.化学物質の毒性の中にはQSAR予測が良好な成績を示し,化学物質管理に実用的に使用されている毒性もあるが,それらの毒性データはPTCコンテストで用いられた発ガン性データのように,毒性あり・なしの2値ではなく,毒性の強度に応じた連続変数データである.したがって,発ガン性データについても発ガン性あり・なしの2値データではなく,発ガン性の強さに応じた連続値データを用いれば,既存手法より高い精度の発ガン性予測手法を開発できる可能性がある.動物試験による発ガン性はIARC,EPA,NTP等様々な機関で収集評価しているが,評価の信頼度は機関によって異なり,また同一の化学物質でも機関で異なる発ガン性のランクに評価されているものもある.そこで,信頼度の高い機関による評価を中心に,各機関のランクを総合的に評価して,計9段階に格付けした発ガン性ランクデータベース(CRDB)を開発した.すなわち,発ガン陽性は最も信頼度の高いAランクから最も低いDランクまで4段階,陰性も最も信頼度の高いIランクから最も低いFランクまで4段階,及び陽性・陰性の判定不明のEランクの計9段階である.量子化学的記述子を用いてこの発ガン性ランクデータをニューラルネットワークで解析した結果,平均誤差0.007,2乗相関係数0.999という高い精度で広範囲の化学物質の発ガン性を予測できることが分かった.このことは,既存の発ガン性あり・なしの2値のデータを収録したデータベースではなく,ここで構築した多段階の発ガン性データベースが高精度の発ガン性予測手法の開発に有効であることを示している.
|