• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Multimodal Bioactivity Data Integration and Utilization Infrastructure Design

Planned Research

Project AreaLatent Chemical Space Based on Diverse Natural Products for Bio-active Molecular Design
Project/Area Number 23H04886
Research Category

Grant-in-Aid for Transformative Research Areas (A)

Allocation TypeSingle-year Grants
Review Section Transformative Research Areas, Section (II)
Research InstitutionKitasato University (2024)
Kyoto University (2023)

Principal Investigator

鎌田 真由美  北里大学, 未来工学部, 教授 (70749077)

Project Period (FY) 2023-04-01 – 2028-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥62,010,000 (Direct Cost: ¥47,700,000、Indirect Cost: ¥14,310,000)
Fiscal Year 2025: ¥12,740,000 (Direct Cost: ¥9,800,000、Indirect Cost: ¥2,940,000)
Fiscal Year 2024: ¥7,670,000 (Direct Cost: ¥5,900,000、Indirect Cost: ¥1,770,000)
Fiscal Year 2023: ¥13,520,000 (Direct Cost: ¥10,400,000、Indirect Cost: ¥3,120,000)
Keywordsデータ統合 / データモデル / マルチモーダル / マルチモーダルデータの統合 / マルチモーダルデータ / データ基盤構築
Outline of Research at the Start

データサイエンスや人工知能の適用において、入力となるデータ準備はその起点であり、情報活用の成功を左右する。天然物および標的タンパク質に関する種々の計測データは実に多様なマルチモーダルデータとして取得されるが、その利活用には、データの持つ多次元性や多階層性を表現するための柔軟なデータモデルと標準化が必要である。そこで本研究では、独自のマルチモーダルな生物活性データに対し、既存の大規模公共データベースとの統合およびモーダル間連携のための新たなデータモデルを策定し、AI Readyな共有データ基盤を構築する。

Outline of Annual Research Achievements

データサイエンスや人工知能の適用において、入力となるデータ準備はその起点であり、情報活用の成功を左右する。A01班により産み出される天然物および標的タンパク質に関する種々の計測データは多様であるため、データの標準化抜きに情報活用することはできない。また、これらマルチモーダルなデータが持つ多次元性や多階層性を表現するためには、柔軟なデータモデルが必要となる。この独自の生物活性データを既存の大規模データベース情報と統合し、B01班の研究者が独自に開発するNP-VAEやQEPPIなどの様々なアルゴリズムに適用可能なAI Readyな共有データ基盤を構築することで、従来のケミカルバイオロジーでは実現困難であった個別の活性情報の利用を初めて可能にし、化合物潜在空間の飛躍的拡張に繋げることが可能となる。そこで本計画研究班では、マルチモーダルな生物活性データに対し、公共データベースとの統合およびモーダル間連携のための新たなデータモデルを策定し、サイバー生物活性分子デザインラボの中核を担うことで、本学術変革領域の発展に資することを目指す。
2023年度は、A01班との連携により、メタデータの標準化とオントロジーの整備、データ統合のためのデータスキーマ・データモデル策定を行った。具体的には、A01班から提供されるデータについて調査を行うとともに、天然化合物の主要なデータベースの調査を行った。調査の結果に基づき、独自データおよび本領域で重要な公共データベースであるPubChemやChEMBLとの接続性について検討し、メタデータの策定およびデータスキーマの検討を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

該当年度に予定していた調査およびデータモデル策定が概ね完了していることから、概ね順調に進展していると判断した。

Strategy for Future Research Activity

2024年度は昨年度策定したデータモデル・スキーマを元にデータ基盤のプロトタイプ策定を実施する。さらに、B01班と連携し、化合物類似検索手法の開発と具体的なデータ活用のためのユースケースおよびクエリの検討を行い、データモデルの改良を実施する。

Report

(1 results)
  • 2023 Annual Research Report
  • Research Products

    (3 results)

All 2023

All Presentation (3 results) (of which Invited: 1 results)

  • [Presentation] pplication of Machine Learning Models in Prediction of Disease Therapeutic Target Molecules Using Gene Expression Profiles2023

    • Author(s)
      Narumi Hatano, Mayumi Kamada, Ryosuke Kojima, Hiroaki Iwata, Yasushi Okuno
    • Organizer
      情報計算化学生物学会2023年大会(CBI2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] Elucidation of Mortality Triggers Using Temporal Predictive Models2023

    • Author(s)
      Tatsuki YAMAMOTO, Yuzuha TSUJI , Minoru SAKURAGI , Yuji OKAMOTO , Mayumi KAMADA , Yasushi OKUNO
    • Organizer
      情報計算化学生物学会2023年大会(CBI2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] 医療・創薬研究におけるデータ統合2023

    • Author(s)
      鎌田 真由美
    • Organizer
      2023年日本バイオインフォマティクス学会年会・第12回生命医薬情報学連合大会(IIBMP2023)
    • Related Report
      2023 Annual Research Report
    • Invited

URL: 

Published: 2023-04-13   Modified: 2025-04-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi