研究課題
細胞分化過程における遺伝子制御ネットワーク構造変化の解析には、ヒストン修飾情報や近隣の遺伝子の発現量を特徴量とした、細胞種特有な転写因子の結合を推定が重要となる。また、細胞種特有の転写因子の結合推定の高精度化には、各特徴量の高精度化が望まれる。本年度は、上記特徴量の高精度化及び特徴量からの高精度な細胞種特有の転写因子の結合推定の2課題について取り組んだ。前者については、単純反復配列、コピー数変異、HLA領域などの難読化領域におけるゲノム情報がヒストン修飾、転写因子の結合情報取得のためのChIP-Seq解析でのピークコールの高精度化において求められる。単純反復配列について、フェージングされた周辺SNPからの遺伝子系図情報を用いた次世代シークエンシング(NGS)データによる高精度な単純反復配列構造推定手法を提案した。コピー数変異について、既存手法では、似通ったゲノム領域においては、コピー数が合わせて求められる問題があったが、集団のNGSデータからLDAを元にしたモデルにより異なるゲノム領域のコピー数として分離・推定する方法を提案した。HLA領域については、昨年度提案のRNA-Seqからの発現量推定法を拡張し、既知HLA領域を鋳型とし、NGSデータからのリードをマップすることで既存手法より高精度にHLA型を推定する方法を提案した。また、特徴量の1つとして重要な遺伝子発現量の推定について、昨年度提案のRNA-Seqから発現量推定法において、パラメータ更新の枝刈りにより精度を維持したままの高速化を実現している。後者課題では、マウスにおけるES細胞から心臓細胞への分化過程におけるRNA-Seqデータ、ヒストン修飾及び転写因子のChIP-Seqデータからのヒストン修飾情報等の特徴量と転写因子結合の正例・負例のデータをDeep Neural Networkで学習し、既存手法より高精度に細胞種特有の転写因子結合情報を推定する手法を提案した。
すべて 2015 2014
すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 3件) 学会発表 (2件) (うち招待講演 1件)
BMC Genomics
巻: 16(Suppl 2) ページ: 1-6
BMC Bioinformatics
巻: 16(Suppl 1) ページ: 1-8
Lecture Notes in Computer Science
巻: 8542 ページ: 107-118
巻: 8542 ページ: 208-219
巻: 15(Suppl 9) ページ: 1-9