2019 Fiscal Year Research-status Report
Selective exploration of anti-inflammatory substances using chemical big data
Project/Area Number |
19K23813
|
Research Institution | Ritsumeikan University |
Principal Investigator |
小川 慶子 立命館大学, 薬学部, 助手 (20844278)
|
Project Period (FY) |
2019-08-30 – 2021-03-31
|
Keywords | ビッグデータ / ケモインフォマティクス / 炎症抑制物質 / データベース |
Outline of Annual Research Achievements |
本研究は化合物ビッグデータを利用し、情報処理技術を用いて過去に蓄積されたデータから活性化合物の構造特性を明らかにすることで、炎症抑制活性の発現に有用な骨格・部分構造を開拓することを目的とする。また予測結果に基づいて化合物群の活性評価を実施し、結果を予測段階へフィードバックすることで、より高精度な予測手法の確立を目指す。本研究では 1)化合物ビッグデータを用いた有用骨格候補の絞り込み 2)活性試験による予測結果の検証 の実施を計画しており、本年度は 1) に主眼を置いて研究活動を実施した。 活性化合物の構造特性を検討する目的で、まずはじめにPUBCHEM、ChEMBL等の化合物データベースを用いて「活性化合物の化学構造データセット」および化合物をランダムに収集した「対照用化学構造データセット」を作成した。それぞれのデータセットについて構造記述子を算出し、得られた記述子を用いてクラスター分析を行ったところ、良好なクラスタリング結果は得られなかった。原因として、対照用データセットに含まれる化合物に偏りが生じていることが考えられたため、対照用化学構造データセットの作成方法を変更し、天然物の各生合成経路による分類に基づいて化合物を収集した。そのうえで再度同様の方法でクラスター分析を行ったところ、解釈可能なクラスターを得ることができた。 続いて、用いる構造記述子の選択やデータセットの配合比率を変化させて分析条件の検討を行った。その結果、活性化合物が高い割合で集積したクラスターXを見出した。現在、クラスターXに含まれる化合物の構造特性の解析を進行中である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
はじめに作成した対照用化学構造データセットでは化合物の収集をランダムに行っていたため、収載された化合物の種類に偏りを生じる場合があると考えられた。そこで各生合成経路に基づいた分類方法により化合物を収集し、各分類ごとにランダムに同数の化合物を抽出したデータセットを用いてクラスター分析を行うことで、クラスタリングの結果に改善が見られた。 上記の過程において、天然物化学の観点に基づいた化合物分類は多くのデータベースで採用されておらず、化合物の構造情報収集の段階に時間を要した。 また、特に希少骨格についてはデータベースへの収載自体がされていないこともあるため、本方法で収集した化合物は比較的メジャーな骨格が大部分を占めると考えられる。 今後、天然物に特化したデータベースを導入して併せて検討を行っていくことを計画している。
|
Strategy for Future Research Activity |
(1) 有用骨格の絞り込み段階において、用いる構造記述子の選択やデータセットの作成方法を調整し、クラスター分析の条件を確定させる。そののち、活性化合物が高い割合で含まれているクラスターXについてどのような構造特性を持つ化合物が集約しているかを検討し、条件を満たす候補骨格を絞り込む。 (2) (1)で得られた結果に基づき、化合物ライブラリから候補骨格を有する化合物の生物活性試験を行い、活性化合物の提案を行う。また、(1)の予測結果と(2)の検証結果を比較検討し、予測段階へのフィードバックを行うことを計画している。
|
Causes of Carryover |
2019年度の活動により、活性化合物に類似した構造特性を示す化合物群をクラスター解析により絞り込むことができた。しかしながら、クラスタリング結果はデータセットに含まれる化合物情報に大きく影響を受ける点を鑑みると、既存の化合物データベースでは希少骨格や天然物骨格の収載に限りがあり、希少な骨格に対する検討が十分になされていないことが懸念された。そこで、研究代表者は2020年度において天然物データベースを購入、導入してさらに検討を実施する必要性が高いと判断した。天然物データベースを用いた結果と2019年度の結果を比較検討することで、より詳細・具体的な活性化合物探索に活かすことができると確信している。
|