研究課題/領域番号 |
16K00387
|
研究機関 | 早稲田大学 |
研究代表者 |
大里 直樹 早稲田大学, 理工学術院総合研究所(理工学研究所), 主任研究員 (50509536)
|
研究期間 (年度) |
2016-04-01 – 2023-03-31
|
キーワード | 転写制御 / 転写因子 / エンハンサー / クロマチン相互作用 / インシュレータ / 遺伝子発現 / ヒストン修飾・オープンクロマチン / 深層学習 |
研究実績の概要 |
ゲノムワイドな遺伝子転写カスケードの解析のために、遺伝子の転写開始点から離れた位置(遠位)のDNAに結合する、転写因子が発現を制御する遺伝子(転写標的遺伝子)を予測する手法を開発した。転写標的遺伝子の予測のために、転写因子のDNA結合の位置と遺伝子の転写開始点の対応関係の基準を評価するための指標を見出した。同じ転写因子の転写標的遺伝子には、似た機能をもつ遺伝子が多く含まれ、遺伝子機能の数を転写標的遺伝子の延数で正規化した値が大きいほど、正しく予測された転写標的遺伝子を多く含み、対応関係の基準を評価する指標となった。より良い対応基準を見出し、転写因子と転写標的遺伝子の相互作用を遮蔽して制御するインシュレータ機能に関わる転写因子CTCFのDNA結合の位置を考慮した対応基準では、さらに良い予測結果が得られた。別の指標として、同じ転写因子の転写標的遺伝子の発現量の中央値を見出した。分化成熟した免疫細胞では、転写因子の転写標的遺伝子の発現量の中央値の分布が大きいほど、正しく予測された転写標的遺伝子を多く含み、ESやiPS細胞の幹細胞では、中央値の分布が小さくなる傾向が示された。この結果は、幹細胞では遠位に結合する転写因子が遺伝子発現の抑制として、免疫細胞では活性として機能する傾向を示唆した。 CTCF以外のインシュレータ機能に関わる転写因子を探索する手法を開発した。転写標的遺伝子の対応基準の解析と統計検定を用いた手法を開発し、さらに深層学習を用いた手法で、より正確な予測を行い、既知の転写因子を含む98の転写因子を予測し、そのうち23の転写因子について、論文を調べ、インシュレータ機能に関わる報告を見つけた。大部分はCTCFのインシュレータ機能と関わる転写因子であった。特に転写因子MAZについて、2021年にCTCFと独立してインシュレータ機能をもつことも実験により示された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画の(1)オープンクロマチン領域の同定及び転写因子のDNA結合配列探索の方法と条件の検討については、DNase-seqのオープンクロマチン領域の実験データと転写因子のDNA結合モチーフ配列のデータから、転写因子のDNA結合位置をより正確に予測する手法(PIQ)が発表され(Sherwood RI, et al. Nat Biotechnol. 2014)、この手法を用いて、共用のPCクラスターで並列して実用的な時間で、様々な転写因子のDNA結合位置を解析するプログラムを作成した。 研究計画の(2)転写標的遺伝子の機能の偏りに基づく、エンハンサー領域の基準の選択については、インシュレータ機能をもつCTCFのDNA結合位置を考慮すると、より良い対応基準となることが示された。転写標的遺伝子の発現量の中央値も同様に対応基準の選択の指標となることがわかった。 研究計画の(3)ヒストンのエピゲノム修飾と転写因子のDNA結合配列のゲノム上の重なりや近接の解析については、遺伝子発現量を用いた、転写因子のDNA結合位置と転写標的遺伝子の対応基準の解析を用いて、免疫細胞においてエンハンサー活性のあるDNA配列をk-mer法により網羅的に予測した。予測されたDNA配列は、エンハンサー活性と関わるヒストン修飾のピークとよく重なることが明らかとなった。またインシュレータ機能と関わる転写因子の網羅的な予測では、遺伝子の転写の活性と抑制に関わるヒストン修飾の境界となる位置に、予測された転写因子のDNA結合が多く見られた。 研究計画の(4)クロマチン(染色体)相互作用を予測する方法の開発については、クロマチン相互作用やインシュレータ機能と関わる転写因子の網羅的な予測を行い、当初の期待よりも多くの転写因子が予測された。この結果から転写因子のDNA結合と転写標的遺伝子の対応をより正確に予測できる。
|
今後の研究の推進方策 |
研究計画の残りの転写カスケードの予測に関する項目について、深層学習を用いた転写カスケード解析を進める予定である。インシュレータ機能に関わる転写因子の網羅的な予測の解析で、深層学習を用いた手法を開発し、細胞や組織の遺伝子発現量の予測に関わる因子を高い精度で解析できることがわかった。各遺伝子の発現制御に関わる転写因子と発現量の変化を対応させることができ、その結果を組み合わせて転写カスケードを調べることが期待される。さらに深層学習により、転写カスケード全体を一度に解析できるような手法の開発を目指したいと考えている。
|