研究課題/領域番号 |
22K06189
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分43060:システムゲノム科学関連
|
研究機関 | 東京大学 |
研究代表者 |
中井 謙太 東京大学, 医科学研究所, 教授 (60217643)
|
研究分担者 |
VANDENBON ALEXIS 京都大学, 医生物学研究所, 准教授 (60570140)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | ハウスキーピング制御領域 / DNAメチル化 / 大規模言語モデル / がん抑制遺伝子 / コファクター / 細胞種特異的発現制御 / クロマチンループ / 自然言語モデル / ゲノム情報解析 / モチーフ文法 |
研究開始時の研究の概要 |
近年、細胞種特異的遺伝子発現に果たすエンハンサー配列の役割が注目されている。しかし、 エンハンサー配列は進化的保存が控えめで、その基本構造の理解はエンハンサー文法問題と呼ばれる大きな謎になっている。本研究では、以下の3つの側面から、この問題の解決を目指す。 1) 細胞種特異的発現遺伝子エンハンサーにみられる頻出モチーフパターンの抽出 2) 類縁細胞種間比較解析によるクロマチンループ構造の階層性の発見 3) 言語モデルによるエンハンサー文法理解
|
研究実績の概要 |
本研究課題では、遺伝子発現の細胞種特異性を制御するDNA配列上の仕組みを理解することを主な目標としており、以下に示しように本年度ももちろんその方向での成果はいくつも得られているが、驚いたことに、本年度の最大の成果は、どの細胞でも遺伝子発現を活性化すると思われるハウスキーピング制御エレメントに関する研究であった。 もともとは、エピジェネティック情報に基づいてエンハンサー領域の活性度を推定するABCスコアを使って、ヒトゲノム上のエンハンサーが何種類の細胞で活性化されているかの分布を調べたことから、ヒトゲノム上には約11,000箇所のハウスキーピング制御エレメントが存在することを発見した。それらのエレメントの多くは、タンパク質コード遺伝子のコアプロモーター領域と記載されている領域と重なっていたので、最初は単に、ハウスキーピング遺伝子のプロモーターを同定しただけかと思われたが、これらのエレメントの直下にあるのはハウスキーピング遺伝子だけではなく、また周囲の多数の遺伝子の活性化に関わっているらしいことが示唆され、エンハンサー的な働きを示していると思われた。さらに、それらのいくつかは、がんの細胞株において、メチル化の異常などによって活性を落としており、直下には腫瘍抑制効果が報告されているジンクフィンガー遺伝子が多く存在することなどから、広くがんの抑制に関わっていることが示唆された。 この他、近年多くの研究者に利用され始めているtransformerという自然言語処理手法を応用して、エンハンサーとプロモーターの相互作用の有無を予測する方法を開発した。関連技術の応用として、RNAスプライス部位予測法やRNAの二次構造予測法も開発中である。さらにグラフニューラルネットワーク法を応用したATAC-seqデータ解析法や空間トランスクリプトームデータ解析法も開発し、論文を投稿中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
現在、多くの成果が出ており、予想以上の成果が出ていると言っても過言でないが、本来の目標からはややそれた方向で発展していることは否定できない。ハウスキーピング制御エレメントの研究は、現在Hi-C/Micro-Cデータから見た検証とトルコの研究者との共同研究による実験的検証を進めているので、これらがある程度進んだ段階で、本来のテーマにも取り組みたい。手法として考えている大規模言語モデルなどについては、研究室内でも応用経験を幅広く積みつつあり、より高度な応用ができるものと考えている。また、別方向からのモデル研究で、プロモーターとエンハンサーの相互作用に介在するコファクターの特徴付けもできつつあり、問題はやや複雑になりつつあるが、より真の解答に迫りつつあるものとも考えている。
|
今後の研究の推進方策 |
上述のように、現在は当初の計画である細胞種特異的エンハンサーというよりも、ハウスキーピング制御エレメントの解析に重点をおいている。こちらの方が、先行研究が少なく、新しく大きな成果が出やすいのではという予想を持っている。現在、Hi-Cなどの高次クロマチン構造情報、ガン細胞株を用いた実験情報、マウスゲノムを用いた比較ゲノム手法などを用いた解析を行っているが、最終年度として大規模言語モデルの応用なども試みたい。ハウスキーピングエレメントの比較対象として、細胞種特異的エンハンサーのデータも常に扱っており、本来の計画に沿った研究にもできるだけ取り組みたい。また、LLMなどの手法を応用したさまざまな研究でも優れた成果が出始めており、これらもぜひ論文化して、広く成果を科学界で共有していきたいと考えている。
|