研究概要 |
研究第3年度の本年度は,知織表現の洗練を行うためのマイニングシステムの開発を行い,分類精度の向上に成功し,また対象データ範囲を拡張して,目標とするリスク警告システムを稼働させる見通しを得た.以下に,本年度遂行した研究の内容を項目に分けて示す. 1.MDDRデータベースからドーパミンアゴニスト活性を有する化合物群392種(D1,D2,Dauto)について各種前処理を行い,解析用データセットを整備して,本特定領域研究の各研究班に提供した. 2.化学構造からの線形フラグメント生成法を改良し,水素結合記述の導入,芳香環原子の織別表記,フラグメント構造中間表記の省略,カルボニルの統合原子記述等の機能を導入した. 3.カスケードモデルによるマイニングで支持度の低いフラグメントを含めた多属性を利用可能とするため,属性間の相関に基づく属性選択機能を導入し,全体で2000種程度の属性から,500-600種程度の属性を選択してマイニングを実行できるようにした. 4.上記2,3の機能を検証するため,ドーパミン受容体タンパク質に対して活性を有する化合物群の解析を行い,各活性に対して特徴的な部分構造を抽出することができた. 5.ドーパミンアンタゴニスト活性を有する化合物群の分類で,サポートベクトルマシンを利用することにより,分類精度を90%程度に向上させることができた. 6.類似の括性を持つ一群の化合物に対し,共通して現れる三次元部分構造(フラグメント)を網羅的に探索するシステムを開発し,ドーパミンアゴニスト活性を有する化合物群の特徴フラグメントを抽出することができた.
|