研究概要 |
本研究の目的は、アミノ酸の変異を起こさない同義置換一塩基多型(SNP)やイントロン、UTRなどのタンパク質非コード領域におけるSNPがmRNAの二次構造に与える影響を計算する手法を開発することである。ここでは、リファレンス配列との距離尺度として二次構造を考慮した距離を用い、サンプリングによって取りうるすべての二次構造に関する期待値を計算するアプローチを採った。このアプローチを大規模データに適用してKullback-Leiber距離、Jenssen-Shannon距離、Base-Pairing距離などの識別能力を比較したところ、Base-Pairing距離が二次構造の影響を最も良く同定できることを見出した.また、本研究の前提となるRNA二次構造予測の精度を向上するために、ノンパラメトリックベイズ法を用いたRNA二次構造予測法を開発し、学習データとなる二次構造の複雑さを適応的に学習することによって予測精度を改善できることを示した。また、複数の二次構造確率分布を混合することによって共通二次構造予測の精度を大幅に改善する手法や事前に与えるべきパラメータを期待精度に基づき最適化する手法を開発し,た。さらに、構造が複雑であるためにこれまでの手法ではあまり扱われてこなかった複数のRNA分子の複合二次構造(相互作用)やRNAシュードノット構造を予測する手法の開発し、これまでの手法と比べて大幅な高速化と精度向上に成功した。
|