2010 Fiscal Year Annual Research Report
Project/Area Number |
22240032
|
Research Institution | Kyoto University |
Principal Investigator |
矢田 哲士 京都大学, 情報学研究科, 准教授 (10322728)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 穣 東京大学, 新領域創成科学研究科, 准教授 (40323646)
|
Keywords | 生体生命情報学 / ゲノム / 発現制御 / モデル化 |
Research Abstract |
ここでは、望みの転写活性を示すプロモーターの配列を体系的に設計する方法論の確立を目指している。そこでまず、(1)与えられたプロモーター配列からその転写活性を予測するモデルを開発し、(2)そのモデルを用いて,望みの転写活性を示すプロモーター配列を探索する手法を開発する。今年度は、(1)について精力的な研究を行い、大きな成果を得ることができた。予測モデルの開発とその予測精度の検証は、主として、ルシフェラーゼレポーターアッセイ系を用いて研究分担者が計測した3つのセルラインにおける約500個のヒトプロモーターの転写活性データを利用して行われた。 我々が開発した転写活性の予測モデルは、単純な線形回帰モデルに基づくものであるが、10-分割交差検定による予測精度の検証では、0.65~0.85の高い決定係数が観察された。この予測精度は、質的な転写活性が与えられた場合のプロモーター配列の設計には十分に適用できるものである。また、単純な線形回帰モデルは、プロモーター配列に潜む転写活性の制御コードを理解する上で大変に示唆的である。 我々の予測モデルは、転写活性の高いプロモーター群から導出された線形回帰モデルと転写活性の低いプロモーター群から導出された線形回帰モデルの混合モデルである。各々のモデルは、プロモーターにアノテーションされた転写因子結合部位(TFBS)からの寄与とプロモーターが持つ物理化学的な性質からの寄与の線形和で表わされている。ここでは、~200種類のTFBSと13種類の物理化学的性質の中から、セルラインごとに、予測に有効なものを赤池の情報量基準(AIC)を用いて選択している。AICは、大部分のTFBSと物理化学的性質を取り除き、単純な予測モデルを導出することに成功している。
|
Research Products
(5 results)