研究課題/領域番号 |
24K20886
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東北大学 |
研究代表者 |
安澤 隼人 東北大学, 情報科学研究科, 助教 (80974469)
|
研究期間 (年度) |
2024-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2026年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2025年度: 130千円 (直接経費: 100千円、間接経費: 30千円)
2024年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
|
キーワード | 2次データベース / 大規模言語モデル / 計算コスト最適化 / シーケンスデータ / レギュローム |
研究開始時の研究の概要 |
生命情報科学においては研究の生データを蓄積した1次データベースを元に、特定の知識抽出に特化した2次データベースの構築が行われるが、特に配列情報についてその構築と更新には、規格化の不十分なメタデータと更新頻度の最適化の困難さという問題がある。本研究では、大規模言語モデルを用いたメタデータの規格化と、計算コストの推定による適切な更新頻度を提案する手法の開発を通じて、学術的データベースの持続性を向上させることを目指す。
|