2013 Fiscal Year Research-status Report
Drug candidate discovery by development of a context-sensitive target network similarity metric
Project/Area Number |
25870336
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Kyoto University |
Principal Investigator |
BROWN John 京都大学, 薬学研究科(研究院), 研究員 (90583188)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | ケモジェノミックス / バーチャルスクリーニング / 遺伝子発現 / 機械学習 / 分子ネットワーク / 国際研究者交流 ドイツ / 国際研究者交流 フランス |
Research Abstract |
本研究は数種類のデータに基づきタンパク質と化合物の相互作用をモデルする新方法を目指します。基本的に相互作用モデルは一つのタンパク質と一つの化合物を対象とし、分子の記述子を合わせたデータと相互作用情報を機械学習でモデルを計算します。具体的な記述をいいますと、タンパク質をアミノ酸部分配列の頻度や物理科学的な特徴などとして表現し、化合物を各種類の原始や水素結合数などをベクトルにまとめて表現します。本年度は、研究を二つの方向に進めました。 一つ目は、大量な化合物とタンパク質に対して網羅的に相互作用モデルを適応して予測した相互作用につきましてどのようなパターンが存在するか確認しました。また、予測結果において複数のタンパク質のファミリーに結合する化合物を特定でき、「一つの化合物は一つのタンパク質ファミリーのみに結合する」という理論を覆す結論を発表できました。さらに、フランスのストラスブール大学との共同研究により相互作用モデルの良さを統計的に評価する新手法を構築でき、初めて「ケモジェノミックスモデル空間」を雑誌論文で提案しました。 二つ目の進歩は、分子信号伝達ネットワークに影響する遺伝子発現データの解析フローを独自に構築することに成功しました。この解析法は、サンプルデータを因子分解法により妥当なクラスター数を自動的に推定し、各クラスターに関与する遺伝子を特定します。さらに、予測対象(任意のエンドポイント)に対して関与遺伝子の順位を推定して、エンドポイントのモデルに最も重要と考えれる遺伝子を絞る計算法を作成することができました。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度では約20万化合物を対象として、5種類のタンパク質ファミリーに対して相互作用を予測しました(合計1.7億ペアをバーチャルスクリーニング、Brown, Niijima, Okuno, Molecular Informatics 32:906) 。その結果、一つの化合物が複数のタンパク質ファミリーと相互作用をすることが判明でき、相互作用ネットワークを図化することができました。ネットワークグラフに表現するメリットは、スケールフリー性やクリックの存在を解析することです。本研究で次の相互作用モデルの構築法を議論するときに、本年度の結果を取り入れることができます。 そしてモデルの評価方法論を提案できました。ケモジェノミックスの分野ではいくつかの論文が相互作用モデルの有用性を議論しますが、本格的な統計検証方法は提案されていなかったため、モデリング手法の有用性は議論できない状態でした。また、本年度で発表した「ケモジェノミックスモデル空間クラスター法」を提案するまで、各ケモジェノミックス手法の類似性を定量的に評価することが不可能でした。本年度の達成により、モデルの有用性及び応用性を客観的に評価でき、ネットワーク階層を考慮した相互作用予測器を設計するときに基本的な検証方法となります。 遺伝子発現データの解析プラットフォームの構築に成功したため、ネットワーク型相互作用モデルと遺伝子発現情報をより動的に応用することを期待します。また、開発したプラットフォームでは各遺伝子の重要性を評価できますので、時間毎に遺伝子発現の重要性を集積でき、時系列データとして細胞の信号伝達との関連性を位置づけられ、細胞の動的な行動をより正確にモデリングすることが期待できます。
|
Strategy for Future Research Activity |
今後の研究ではネットワーク型の相互作用モデルを目指します。初年度で別々に解析した相互作用と遺伝子発現情報をどのように組み込むかを議論します。また経時的な遺伝子発現データを利用する方法を検討する必要があります。 Brown et al, J. Comp-Aided Mol Des, in pressの論文ではタンパク質の生物実験評価(アッセイ)による機能的な類似度計算する提案できましたので、タンパク質の物理化学的な特徴情報と機能的な特徴情報をどのように混合するかを検討しモデルの作成に挑戦します。例えばタンパク質ペアに対してそれぞれの類似度を取り入れて平均を計算する方法が簡単に考えられますが、入力データによる動的な手法がより効果的と考えられ、モデリング法の議論をしないといけません。マイクロアレイデータは雑音が多いため、確率論の枠組みで発現量を前処理する方法を取り入れることを検討します。 それぞれの目的を果たすには、情報量の少ない(スパースな)データをどのように対応する共通課題があります。スパースなデータの取扱いと解釈は複数の研究分野では注目が集まっている課題のため、いくつかの分野の論文をサーベイすることを予定しています。
|