細菌や真核微生物のエピゲノム研究では、6mAを含む様々な種類のDNAメチル化を検出可能なPacBioシーケンサーが広く使用されている。PacBioによる配列決定では、ポリメラーゼがメチル化部位に遭遇すると、その塩基を取り込むために長い時間を費やし、その時間はinter pulse duration(IPD)と呼ばれる値として測定される。PacBioメチル化解析のためのバイオインフォマティクス手法では、メチル化検出やメチル化率推定などの様々な下流タスクにIPDを用いるための機械学習モデルがいくつか開発されてきた。本研究では、これらの機械学習モデルの改良を行った。
|