2013 Fiscal Year Research-status Report
機械学習に基づく新しい創薬インフォマティクス-医薬品化合物の分子設計
Project/Area Number |
25540015
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
吉田 亮 統計数理研究所, モデリング研究系, 准教授 (70401263)
|
Co-Investigator(Kenkyū-buntansha) |
伊庭 幸人 統計数理研究所, モデリング研究系, 教授 (30213200)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 化学情報学 / カーネル法 / 分子設計 / 創薬 / マルコフ連鎖モンテカルロ法 |
Research Abstract |
統計科学に基づくドラッグデザイン手法の研究を推進した。具体的には、以下三つの課題に取り組んだ:(1)新規化学構造カーネル(グラフカーネル)の開発、(2)医薬品候補の化学構造から薬理活性や毒性を予測するモデルの開発、(3)カーネル逆像法に基づく化合物の分子設計法の開発。項目(1)のカーネルは、二つの化合物に内在する共通構造を数え上げ、化合物の類似度を評価するものである。化学構造カーネルの研究は1990年代後半から始まり、現在数種類の標準的手法が確立している。しかしながら、従来法は完全に一致する部分構造のみを類似度評価に反映するように設計されており、数原子のミスマッチがある部分構造は類似度に反映されない。本研究では、構造の完全一致という制約を緩和するより柔軟なカーネル(原子環境カーネル)と、動的計画法に基づく効率的な計算手法を開発した。さらに原子環境カーネルをサポートベクタマシンや回帰モデルと組み合わせ、化合物のアッセイデータから予測モデルを構築した。学習には12種類のデータセット(発がん性、薬理活性など)を用い、従来法の予測精度を大きく上回るモデルを得ることができた(項目(2))。項目(3)では、実験データから予測モデルを構成する過程で、化学的性質に特異的な構造を同定し、複数の化学構造を特徴空間上でブレンドすることで、新規化合物の設計を試みた。再生核ヒルベルト空間上で、混合化合物のイメージポイントを定め、新規化合物と混合化合物のノルムをギブス分布のエネルギーとする。この分布からラベル付き無向グラフをサンプリングすることで、混合化合物の内点近傍に分布する新規化学構造を探索する。フラグメントアセンブリMCMC法という手法を開発し、化合物グラフのランダム・サンプリングを行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
カーネルと予測モデルの開発については、おおむね順調に進展し、論文をJournal of Chemical Information and Modeling誌に発表した。カーネル逆像法に基づく分子設計については、現在提案手法の数値検証を行っている段階である。
|
Strategy for Future Research Activity |
カーネル逆像法に基づく分子設計に関して、設計用の目標分布に強い多峰性があることが問題となっている。したがって、化合物のサンプル系列が局所領域に停滞してしまい、多様な設計分子を抽出することが難しい。平成26年度は、この問題に重点的に取り組む。
|
Expenditure Plans for the Next FY Research Funding |
MCI(Many Integrated Core)搭載計算機を購入し、本研究の分子設計アルゴリズムを実装する予定であったが、開発が予想よりも遅れたため、購入時期を遅らせることにした。 2014年度の夏以降、MCI搭載計算機を購入する。
|
Research Products
(4 results)