公募研究
染色体高次構造と転写との関係解明に役立つ数理モデルの構築と評価を行った。まず、関連データが比較的豊富なB細胞を題材に選別し、大量のパブリックHi-Cデータ、ChIP-seq、RNA-seqデータ等の解析を行った。この解析結果から、胚性幹細胞とB細胞、リンパ腫での染色体高次構造は互いに保存されているが、リンパ腫形成ではおおよそ10%のゲノム領域にクロマチン変化がみられ、腫瘍性異常発現遺伝子がこの領域に含まれていることがわかった。そこで、正常B細胞とリンパ腫の間で変動する遺伝子発現を予測する線形回帰モデルを構築・評価した。これは、Hi-C法によるDNA相互作用、ChIP-seqによるヒストン修飾情報、in-silico転写因子結合部位を説明変数とし、RNA-seqによる遺伝子転写量を目的変数とするモデルである。そして、我々が開発している最良モデル選択手法によって、実測発現量を相関係数 0.7以上で予測するモデル構築に成功した。この過程で、ヒストン修飾と染色体内長距離DNA相互作用の顕著な寄与が見いだされた。開発中のDBに関連情報を集約しつつ、DB機能拡張と整備、広報を続けてきた。また、領域内の共同研究を行っており、山中総一郎先生(慶応大)とは、マウスゴノサイトでの染色体高次情報を解析し、出生前後における長距離DNA相互作用の一時的な動態変化の重要性を見出した(論文投稿中)。宮成悠介先生(基生研)とは、遺伝子改変ヒト細胞ATAC-seq、ChIP-seq等で染色体構造制御因子のスクリーニングと機能推定を行った。
2: おおむね順調に進展している
上述のように細胞選別と数理モデルの構築と評価はおおむね済んでおり、順調に進んでいる。また、OpenLooperの機能改良も行っていて、本研究課題であるデータベースと数理モデルの融合が見込めるようになった。しかし、DNAメチル化データ解析は、研究協力者の李が離職したため、ヒストンを中心としたエピゲノム状態の動的変化と染色体高次構造変化、転写制御の関連性解析に注力してきた。
これまでの数理モデリングで分かってきた主要説明変数の生物学的な意味解釈が欠かせない。とりわけ、同一染色体上DNA相互作用について、例えば、エンハンサーとプロモータ―相互作用、エンハンサーとエンハンサー相互作用などに分類することを試みて、詳細な意味づけのための計算機シミュレーションや統計処理を行う。また、本モデリング手法は現在、開発しているデータベースOpenLooperにウェブツールとして組み込む予定であり、早い段階で論文発表等を通じて一般公開を行う。
すべて 2019 2018 その他
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (6件) (うち国際学会 1件) 備考 (1件)
BMC Medical Genomics
巻: 11 ページ: 127
10.1186/s12920-018-0437-8
https://openlooper.hgc.jp/index.php