Research Abstract |
研究第3年目にあたる本年度は,昨年度収集した老人病院の診療記録について,薬効評価を中心としてさらなるマイニング作業を進めるとともに,医薬品群の特徴的構造のマイニング,それらを支えるマイニングの理論面,およびシステムの実装についても幅広く研究を遂行した.以下に本年度行った研究の内容を項目に分けて示す. 1.本研究開始時に収集した老人病院受診者125人の診療記録データについては,薬効評価のマイニング結果にもとついて,医師である一石がその内容を再精査し,薬効評価の再確認を行った.それにもとづいて,マイニングを進めた結果,薬品問相互作用についてより明確な結果を得ることができた.さらに,これらの患者について追跡調査を行った.このデータについては,SNPsの測定結果と合わせて,来年度解析を進める予定である. 2.多数の医薬品に対して,その薬効とMedlineにおける関連遺伝子群の出現頻度,およびその医薬品を投与した場合の重要な遺伝子群の発現強度データを入手し,内容について予備的な検討を行った.本データに関しても,来年度解析を進める予定である. 3.医薬品の化学構造と生理活性間の相関を調べるマイニングにおいては,カスケードモデルによる出力ルール数の削減に成功し,化学者の協力を得て,特徴的な化学構造の抽出を実際に行えるようにシステムを整備した.ドーパミンのD1-D4およびDautoの各受容体に対して,アゴニスト,アンタゴニスト活性を有する化合物群の特徴抽出に成功した. 4.データ分布の全貌を把握するための方法として,カスケードモデルのような部分的な特徴を把握するだけでなく,大きな傾向をも把握する必要がある.そのためには,主成分分析のような方法が,数学的に素直で性質がよいが,名義変数を含むデータに適用できない難点があった.そこで,Giniの定義した名義変数の分散を共分散に拡張するための理論整備とシステム構築に成功した.この方法では,名義変数の各値をregular simplexの頂点として扱って合理的な共分激を得ることができるとともに,主成分分析によりKL-plotを生成でき,しかもその主軸を容易に解釈できる.来年度はこの方法を上記1,2のデータに適用する予定である.
|