我々がこれまでに開発してきたPHi-C法は、次世代シーケンサーを用いた3次元ゲノム構造解析法であるHi-C法のデータを高分子ダイナミクスとして解読することのできるソフトウェアである。さらに、PHi-C法の拡張としてゲノム3次元構造に潜在する動的レオロジー特性を抽出する計算手法も開発してきた。PHi-C法のアルゴリズムには、最適化のための計算ボトルネックやユーザビリティの悪さなどがあったため、その改善に取り組んだ。まず、Hi-Cデータと高分子モデルのパラメータ間における数学的な対応関係を明らかにすることに成功した。さらに、最適化アルゴリズムの改善によって、計算スピードと精度が飛躍的に向上した。そして、ユーザビリティの向上のために、コマンドラインインターフェースによる仕様設計に変更した。最終的に、これらの改善点に基づいてPHi-C法をアップデートすること「PHi-C2」に成功した。現在、論文を投稿し、プレプリントはbioRxivにて公開している(https://www.biorxiv.org/content/10.1101/2022.05.06.490994)。ソースコードに関してはhttps://github.com/soyashinkai/PHi-C2で公開している。 PHi-C2によって、より詳細にゲノム3次元構造に潜在する動的レオロジー特性をゲノム座標に沿って表現できるようになってきた。このような新規データセットに対して各種クラスタリング手法を適用することで、時間的変動の特徴を分類することが可能になってきた。一方で、別の生物学的意義のあるデータセットと組み合わせることには課題が残っており、今後さらに研究を進めていく必要がある。
|