研究課題/領域番号 |
24K20890
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
李 鴻敏 東京大学, 大学院新領域創成科学研究科, 特任研究員 (30987251)
|
研究期間 (年度) |
2024-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2025年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
|
キーワード | RNA配列 / 大規模言語モデル / マルチモーダル学習 / DDBJ / Rfam |
研究開始時の研究の概要 |
本研究では、RNAの構造と機能の関係性を解明するために、最先端のディープラーニング技術を活用します。DDBJおよびRfamデータベースから約1億のRNA配列とそれに関連するテキスト情報を収集し、RNA配列に特化した大規模言語モデルの開発を行います。令和6年度には、必要な計算リソースの確保とデータの収集・前処理を行い、令和7年度には、モデルの訓練と最適化を進め、研究成果の分析と発表を行います。学会参加を通じた情報交換も積極的に行い、研究の進展を促します。本研究の成果は、生命科学の新たな理解への貢献のみならず、医療やバイオテクノロジー分野における応用可能性をも広げることを期待しています。
|