研究課題/領域番号 |
22K17992
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 筑波大学 |
研究代表者 |
尾崎 遼 筑波大学, 医学医療系, 准教授 (10743346)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 機械学習 / プロモーター配列 / 深層生成モデル |
研究開始時の研究の概要 |
ヒトの健常・疾患臓器の研究において特定の細胞型を可視化・分取・追跡・摂動・制御するために、分子・細胞生物学ツールを特異的に発現させるプロモーター配列が必要となる。従来、発現特異性を示す内在性遺伝子(マーカー遺伝子)のプロモーター配列(既存配列)を用いていたが、細胞分類の細分化が進み、単一のマーカー遺伝子が見つけるのが困難になっている。そこで本研究では、マーカー遺伝子に頼らずに、深層学習によって特異的発現プロモーター配列を人工的に設計する手法を開発する。さらに、開発した手法を複数のデータセットに適用し、細胞型特異的な人工プロモーター配列のデータベースを構築する。
|
研究実績の概要 |
ヒトの健常・疾患臓器の研究において特定の細胞型を可視化・分取・追跡・摂動・制御するために、分子・細胞生物学ツールを特異的に発現させるプロモーター配列が必要となる。従来、発現特異性を示す内在性遺伝子(マーカー遺伝子)のプロモーター配列(既存配列)を用いていたが、細胞分類の細分化が進み、単一のマーカー遺伝子が見つけるのが困難になっている。 そこで本研究では、マーカー遺伝子に頼らずに、深層学習によって特異的発現プロモーター配列を人工的に設計する手法を開発する。さらに、開発した手法を複数のデータセットに適用し、細胞型特異的な人工プロモーター配列のデータベースを構築する。 その中で、2023年度では深層生成モデルの一つの拡散モデルによって人工的に設計する手法の概念設計・実装・検証を進めた。具体的には、画像生成において精度が高いことが知られる、拡散モデルの一つであるデノイジング拡散確率モデル(DDPM; Denoising Diffusion Probabilistic Model) [Ho et al. 2020]によって、塩基配列を出力するように学習した生成モデルを構築した。さらに望みの発現プロファイルを示すプロモーター配列を生成するために条件付き生成を用いた。具体的には条件付き生成の手法として、分類器無しガイダンス (classifier-free guidance) [Ho et al. 2022]を選択した。DDPMにおける逆拡散過程のモデルはU-Net、損失関数は平均二乗誤差 (MSE) を用いた。シミュレーションデータによる精度評価のため、2つの細胞型A、B に対応する発現量が複数種類のモチーフから計算される配列データセットを作成し、本モデルを適用した。その結果、複数種類の細胞型について、望んだ発現プロファイルを示す配列の生成に成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究では、マーカー遺伝子に頼らずに、深層学習によって特異的発現プロモーター配列を人工的に設計する手法を開発することを目指している。その中で、当初の計画よりも、手法の実装とその精度検証に時間を要した。そのため、進捗に遅れが生じている。
|
今後の研究の推進方策 |
引き続き手法の実装と精度検証を進め、深層学習によって特異的発現プロモーター配列を人工的に設計する手法の構築を進める。また、開発した手法を複数のデータセットに適用し、細胞型特異的な人工プロモーター配列のデータベースを構築することを目標とする。さらに、それらの成果を、学会での口頭・ポスター発表および論文として発表することを目指す。
|