2007 Fiscal Year Annual Research Report
自然言語解析による薬物代謝情報の網羅的収集と知識ベースの構築
Project/Area Number |
18590140
|
Research Institution | Kyoto University |
Principal Investigator |
山下 富義 Kyoto University, 薬学研究科, 准教授 (30243041)
|
Keywords | 薬物代謝 / テキストマイニング / 自然言語処理 / 構造活性相関 / 情報可視化 / 決定木モデル / 階層型データ / 多目的同時最適化 |
Research Abstract |
薬物の代謝は,医薬品の作用部位への到達性および滞留性を決定する薬物動態関連因子の一つである。昨年度は,薬物と代謝酵素との相互作用に関する情報を網羅的に収集する方法として,化合物名および酵素に関する辞書データベースの作成を中心に,テキストマイニング技術の基盤の構築を行ったが,本年度は文脈に基づくセマンティック解析の効率を向上させるためにルールベースの充実を図り,関連する名詞句から化合物名を特定する方法や動詞から化合物と酵素の相互作用様式を特定する方法を実装した。薬物の肝代謝の約50%に関与すると言われているCYP3A4を例として関連するPubMedアブストラクトを解析した結果,化合物名および相互作用様式の抽出に対して85%以上のリコールと90%以上の精度を誇るシステムが完成した。さらに,この解析を代表的なCYP分子種6種に絞って適用した際には2000化合物の相互作用データ9000個を得ることができた。また,多変量の大規模情報可視化技術として,階層型データ可視化法「平安京ビュー」を拡張し,情報利得を分岐基準とする決定木モデルとの組み合わせにより,CYP代謝と薬物の化学構造の関係の全体像を可視化し,包括的に解明する方法論を開発した。その結果,CYP2E1基質は分子量が小さく,逆にCYP3A4基質は大きいこと,CYP2D6基質にはカチオン性化合物が多いことが明らかとなった。本情報は,最近臨床において問題となっている薬物間相互作用を未然に防いだり,創薬研究において薬物動態学的視点より最適な分子設計を行う上で有効な指針を提供するものと期待される。
|