2006 Fiscal Year Annual Research Report
自然言語解析による薬物代謝情報の網羅的収集と知識ベースの構築
Project/Area Number |
18590140
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kyoto University |
Principal Investigator |
山下 富義 京都大学, 薬学研究科, 助教授 (30243041)
|
Keywords | 薬物代謝 / テキストマイニング / 自然言語処理 / 構造活性相関 / 遺伝的アルゴリズム / 情報可視化 / 化合物情報 / 判別分析 |
Research Abstract |
薬物の代謝は,医薬品の作用部位への到達性および滞留性を決定する薬物動態関連因子の一つである本研究では,薬物代謝に関する構造活性相関の知識体系化を最終的なゴールとして,以下に示す2つの技術的な課題をクリアする.一つは薬物と代謝酵素との相互作用に関する情報の網羅的な収集であり,もう一つは得られた情報の分類と整理する方法論の開発である.本年度は,前者に関するテキストマイニング技術の開発を中心に検討を行った.NCBI提供のMeSH Termから化合物名および酵素に関する辞書データベースを作成した.また,タグ作成,形態素解析,構文解析はGATE Ver 2.0の基本コンポーネントを利用することとし,文脈に基づくセマンティック解析により化合物名と相互作用に関する情報を適切に抽出するためのルールベースをJAPE言語でGATEに実装した.このルールベースには,化合物名と密接に関係する名詞(concentrationなど)から化合物名を特定する方法や,注目する名詞(化合物名と酵素名)と動詞(動詞性名詞も含む)の順序から,化合物と酵素の相互作用様式を特定するアルゴリズムも含まれている.一方,分子構造と薬物動態特性との間を相関解析するために,多変量データの中から予測に必要な変数だけを効果的に見出す遺伝的アルゴリズムを利用した解析法を開発した.さちに,2つの群において群間変動を大きくかつ群内変動を小さくするように判別関数を決定する判別分析法を多次元にまで拡張した解析法を開発し,情報可視化により知識発見を行うアプローチについても検討を現在行っている.
|