人工の遺伝子回路の素子は互いに干渉することが多く、そうした複雑さが細胞をプログラムするために使える素子の数を制限し、遺伝子回路の大規模化とプログラムの多様化の大きな障壁になっている。これらの障壁を打ち破るためには、プロモーターの転写活性(培養細胞における転写強度)を巧みに設計することが求められる。しかし、プロモーターの塩基配列と転写活性の関係には未知の部分が多く、これまでは、極めて限られた知識によってプロモーターの転写活性が設計されてきた。ここでは、発見的で限定的な知識ではなく、体系的で網羅的な知識に基づいたプロモーターの転写活性の設計を実現し、人工遺伝子回路の大規模化と細胞プログラムの多様化への道を開く。なお、ここでは、人工遺伝子回路の医学分野への応用を考え、ヒトをモデル生物とし、培養細胞としてHEK293を用いた。
具体的には、まず、野生型プロモーターについて、数万種類の変異型を用意し、それらの転写強度と塩基配列を体系的に測定する実験系を確立した。また、この実験系による測定データに基づいて、野生型プロモーターとその変異型プロモーターの転写強度を1塩基レベルの解像度で推定する回帰モデルを導出するアルゴリズムを開発した。そして、この回帰モデルに基づいて野生型プロモーターの塩基配列を改変し、改変プロモーター配列の合成と転写活性の測定を通してプロモーターの転写活性の設計技術を評価した。まず、GC-richでTATA-containingなEEF1A1プロモーターについて、変異型プロモーターの転写強度と塩基配列のデータを体系的に測定し、それらのデータに基づいてEEF1A1の野生型プロモーターと変異型プロモーターの転写強度を1塩基レベルの解像度で推定する回帰モデルを導出した。この回帰モデルを用いてEEF1A1の野生型プロモーターの塩基配列を改変したところ、転写強度の設計値と実測値の回帰直線y=0.96x-0.09(ほぼy=x)が観察された。
|