研究課題/領域番号 |
23K16991
|
研究機関 | 国立研究開発法人国立がん研究センター |
研究代表者 |
小嶋 泰弘 国立研究開発法人国立がん研究センター, 研究所, ユニット長 (00881731)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
キーワード | 深層生成モデル / 空間トランスクリプトーム |
研究実績の概要 |
本研究においては、申請者が得意とする深層生成モデルによる細胞状態のモデリングに画像からの三次元再構築に利用されるImplicit Neural Representationの技術を組み込むことで、細胞状態に応じた細胞内立体トランスクリプトームの再構築技術の開発を行う。さらに、申請者の開発した細胞状態の確率的ダイナミクス推定の枠組みや配列情報の自己教示あり学習も取り込むことで、RNA分子の配列と転写制御配列に基づいて細胞内局所の転写・分解・輸送を予測する枠組みを構築する。この枠組みを元にすることで、Explainable AI技術の応用によりRNA分子の時空間動態を規定する配列的特徴を抽出し、細胞状態の確率的変化に応じて転写産物の空間分布がいかにして制御されるか、その分子機構も含めて体系的に解明することを目指す。 本年度の研究開発においては、立体トランスクリプトーム再構築技術の開発を行い、マウスの肝臓のseqScopeデータ、並びに、MERSCOPEデータへの適用を行った。マウス肝臓データに関しては、構築された3次元の発現パターンの類似性が、APEX-seqという細胞内小器官ごとのトランスクリプトーム観測により確認されている各細胞内小器官ごとに特異的な遺伝子について高まる傾向が見られた。これは、各細胞内小器官に局在する遺伝子に対して同じような空間分布を推定していることを占めているものであり、本手法の妥当性を示す結果となっている。また、網羅的なタンパク質間相互作用のデータベースから、タンパク質で複合体形成をする遺伝子同士が、RNAの時点で類似した空間分布を持っていることを示唆する結果を得ている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の主な目標は、Subcellular空間トランスクリプトームのデータから3次元の発現プロファイルを再構築する技術の開発となっていたが、こちらについは概ね達成されたと考えられる。また、他にも保管技術の新規開発等さらなる高精度化に向けた技術開発も進んでいる。
|
今後の研究の推進方策 |
代表者はすでにSplicedとUnsplicedの一細胞トランスクリプトームデータから、潜在的な細胞状態とそのダイナミクスを推定する方法論を開発している。本研究では、項目1の立体トランスクリプトーム再構築の枠組みに、潜在細胞状態のダイナミクス推定手法を応用することで、細胞内トランスクリプトームの時空間動態を捉える。具体的には、上述の細胞状態と立体トランスクリプトームの推定を行った上で、それぞれの細胞のSpliced、Unsplicedの発現データから細胞状態の微小時間変化をデータ駆動的に推定する。この微小時間変化の前後の細胞状態での立体トランスクリプトームを再構築し、その差分を計算することで、細胞内の各座標における各遺伝子の発現変化を推定する。これらの発現変化と適合するように、各細胞状態の各細胞内座標における転写産物の転写・分解・輸送をRNAの分子配列、転写制御配列を入力とするNeural networkによりモデル化し最適化をする。この際に、配列的な特徴と細胞内動態の関係性を効率的に捉えることができるように、あらかじめ自己教示あり学習の枠組みによりそれぞれの配列情報の特徴量の抽出をおこなった上で、その特徴量を入力に用いる。最終的には、学習済みのモデルに対してSHAP値解析等のExplainable AI技術を用いることで、細胞内動態の違いに貢献する配列的特徴の抽出を行う。これにより、細胞状態の遷移に伴う細胞内の転写産物の空間分布の変動が、どのような配列的特徴に帰着されるかを明らかにするとともに、既存のRBPやmicroRNAの結合モチーフとの照合により、空間分布を規定する分子機構の解明を行う。
|
次年度使用額が生じた理由 |
今年度に開発された深層学習モデルが想定していたよりも効率的な計算を行えることが判明したため、計算資源の購入に必要な経費が減じた。次年度使用額については、本研究の高精度化を図る研究に関して、研究活動に協力してもらうための人件費に充てる予定である。
|