研究課題/領域番号 |
25830148
|
研究機関 | 独立行政法人理化学研究所 |
研究代表者 |
二階堂 愛 独立行政法人理化学研究所, 情報基盤センター, ユニットリーダー (00383290)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | バイオインフォマティクス |
研究実績の概要 |
時系列ChIP-SeqデータとRNA-Seqをモデリングし転写量を表現する物理化学・統計力学モデルの構築を進めた。まず、統計力学的モデルを構築した。まず標的遺伝子のプロモーター・エンハンサー領域を格子化し、転写因子と基本転写因子のDNAへの結合は格子あたり1つと仮定した。転写因子と基本転写因子の結合により転写が活性化されるとした。また抑制的に働く転写因子は、基本転写因子との結合により、転写を抑制するとした。これらの4つの結合確率の分配関数からモデルを導出した。このモデルへ人工的に生成した時系列転写因子結合データを加えて、計算が適切に行われるプログラムをRで実装した。 次に確率微分方程式と物理化学的な式により、時系列ChIP-SeqデータとRNA-Seqをモデリングし転写量を表現するモデルの構築を進めた。転写因子結合量はヒル式に従い、mRNA分解は線形に進むと仮定し、さらに時間に対し転写量にガウスノイズが含まれるとした、いわゆるランジェバン方程式としてモデルを構築した。 現在、これらのモデルを時系列ゲノムデータに適用しているところでありH26年度には終了する予定であったが、適切な時系列データが不足しているため、H27年度も引き続きモデル化とゲノムデータへの適用を進める。また統計力学モデルではDNAのループなどより高次なエピゲノム情報を取り込むことにより、より現実に近いモデルを構築する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
計画されていた共同研究者からの時系列データの提供が遅れており、物理化学・統計力学モデルのゲノムデータへの応用のためがやや遅れている。
|
今後の研究の推進方策 |
物理化学・統計力学モデルのゲノムデータへの応用のため、実験データを入手する。計画されていた共同研究者からの時系列データの提供が遅れており、公的データベースにあるシーケンスデータの利用も検討する。
|
次年度使用額が生じた理由 |
研究の進捗状況により、データストレージがH27年度にに必要となるため、次年度に持ち越した。
|
次年度使用額の使用計画 |
H27年度予算と合計してよりストレージ量の多い計算機購入に充てる。
|