遺伝情報の発現は、DNA結合タンパク質が特定の塩基配列に結合することによって制御されているが、その塩基配列特異性はタンパク質によって様々である。また、次世代シークエンサーによるChIP-seq 解析により、転写因子などDNA結合タンパク質がゲノムのどこに結合しているかを網羅的に調べることができるようになってきた。しかし、依然としてタンパク質がどのようにDNAを認識しているかはよく分かっていない。そこで、本研究では、タンパク質を設計し、DNAとの結合を実験的に調べることにより、その認識メカニズムの解明に迫った。同時に、複数のDNA結合タンパク質の結合配列データ(ChIP-seqデータ)を解析し、タンパク質の結合とDNAの動特性の関係を調べた。 認識配列を長くするため、2つのDNA結合ドメインを結合したダイマーを作成し、その結合配列をB1Hアッセイによって調べた。 結果、片方のDNA結合ドメインの結合のみで、B1Hアッセイ系が動き、認識配列を長くできなかった。そこで、DNA結合を弱める変異を入れ、2つのドメインが結合して初めてB1Hアッセイ系が動くようにした。結果、結合親和性が約10倍下がったものをダイマーにすることにより、倍の長さのDNAを認識するタンパク質を作成することができた。 一方、DNA配列に依存した動特性の観点から、DNA結合タンパク質の認識塩基配列を解析した。MDデータを機械学習して、DNA配列ごとに12の構造パラメータでDNAの動特性を特徴づけた。この特徴量を用いて1312のDNA結合タンパク質の認識配列を調べたところ、DNAの動特性は、結合領域のみならず、その上流及び下流200 bp まで、DNAが結合しない領域と有意に違いがあることが分かった。このことは、広い範囲のDNAの動特性を調べることで、結合部位予測の精度が向上することを示唆している。
|