• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Development of a Large-Scale Language Model Integrating RNA Sequences and Text

Research Project

Project/Area Number 24K20890
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionThe University of Tokyo

Principal Investigator

李 鴻敏  東京大学, 大学院新領域創成科学研究科, 特任研究員 (30987251)

Project Period (FY) 2024-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2025: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2024: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
KeywordsRNA配列 / 大規模言語モデル / マルチモーダル学習 / DDBJ / Rfam
Outline of Research at the Start

本研究では、RNAの構造と機能の関係性を解明するために、最先端のディープラーニング技術を活用します。DDBJおよびRfamデータベースから約1億のRNA配列とそれに関連するテキスト情報を収集し、RNA配列に特化した大規模言語モデルの開発を行います。令和6年度には、必要な計算リソースの確保とデータの収集・前処理を行い、令和7年度には、モデルの訓練と最適化を進め、研究成果の分析と発表を行います。学会参加を通じた情報交換も積極的に行い、研究の進展を促します。本研究の成果は、生命科学の新たな理解への貢献のみならず、医療やバイオテクノロジー分野における応用可能性をも広げることを期待しています。

URL: 

Published: 2024-04-05   Modified: 2024-06-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi