本研究では真核生物の組織特異的発現などに重要な役割を果たすエンハンサーについて、その組織特異的発現を制御する仕組みとターゲット遺伝子群を、主にゲノム配列情報から理解するための研究を行った。まず、既知のエンハンサー情報を文献から収集し、データベース化することを試みたが、海外で類似データベースが発表されたため、我々が以前構築したホヤの転写データベース DBTGRに関してエンハンサー情報を中心に更新する作業を行った(現在も継続中)。次に、異なる細胞種に対する Hi-Cデータを収集/再解析し、相互比較することで、細胞の種類によって、 TADやA/B コンパートメントなどの構造領域がどのように変化するかを調べ、それらが変化した領域がその領域内にある遺伝子の細胞種特異的発現と相関しているかどうかを調べた。その結果、データ数の関係で統計的有意性は限定的ではあるが、B細胞とそのリンパ腫などの間に、興味深い機能的相関が観察された。さらに、複数の細胞種に対して、塩基配列と各種ヒストン修飾情報などを入力情報として、深層学習の枠組みでエンハンサー予測アルゴリズムを構築した。方法論的には、今のところ、 GCN(グラフ畳み込みネットワーク)という方法が良い成績を示すことを見出している。最後に、細胞種類特異的な遺伝子発現に関与しているエレメントを抽出するために、シングルセルトランスクリプトームデータを用いて、従来の方法より精密な特異的発現情報を抽出する試みを続けている。
|