今年度は解析的に算出した理論の確認のために、Synthetic Dataを生成するアルゴリズムの開発とその実装を行いました。DNAを粗視化して、簡単のためその粒子間の距離を一定とし、その粒子間にバネが張っていると仮定して3次元バネモデルでエネルギーが極小になるような構造を生成するという手段を取りました。そのバネは、DNAの部分領域が漸近することを表すと同時にバネ係数を操作することにより、DNA核内構造のゆらぎを表現するためのモデル化です。 次にこのシミュレーションで求められた曲線の3次元構造から実際のMulti-Cのデータを再現するようなプログラムの作成を行いました。以前に解析的に計算した確率モデルに従い、生成された構造においてDNAの部分領域が漸近していることをコンタクト情報の密度として表現しました。これらのデータに基づいてMCMCによる3次元構造の確率分布を計算するプログラムにかけました。しかし、以前構築した確率モデルは正しくはあったのですが、実際にそれを実行する上での遷移方法では詳細釣り合いの原理を担保できていないことが発覚しました。また、MCMCによって計算された確率を実際の構造と対応させて、分析可能な統計値を得るために複数の状態を重ねあわせた累積確率分布を計算しなければならなくなりました。それらを実現するための新たな方法論の開発に行き詰まり、研究が停止してしまいました。 詳細釣り合いを満たすように現在の状態から過去の状態に等確率で戻る構造変化を確率モデルから生成する方法では計算量が爆発し現実的な手法としては言えない状態で、モデルを粗視化して累積確率分布を得る試みも、柔軟な構造類似度解析をすることでMCMCから算出されたそれぞれの構造をクラスタリングしてそれぞれの代表点に確率を集約するという方向性で進めようとしましたが、それもやはり膨大な計算量故に現実化することはできませんでした。
|