研究概要 |
昨年,ラムダファージDNAについて得た多量の塩基配列の生データについて,得られたデータをデータベース中の既知データと比較し,これまでの日立SQ3000のbase-callerプログラムによる配列決定の精度とその問題点を検討した。その結果,配列精度については実験データによってかなりのふれはあるものの,決定塩基数が300塩基までについては,95-98%の精度で決定できるが,400塩基までとすると90-96%の精度に低下し,さらに500塩基までになるとこの精度は試料によって大きな差異を生じ,高々90%程度まで低下することがわかった。そこで,各塩基の間の間隔(ピークの時間間隔)を測定し統計処理を行ない,3'末端から10,20および30塩基の配列中のそれぞれの塩基の含量と電気泳動時のピーク間隔との関連を調べ,塩基配列と電気泳動の易動度の特色に関して構築したデータベースをもとに,各電気泳動レーン間の各塩基の間のピークの時間間隔を測定し,それによって補正を図るようにbase-callerを変更した。それによって,従来のbase-callerに比較して塩基配列決定の精度の向上が見れられ,300塩基までの配列決定では97-100%,また400塩基までの配列決定についても94-98%の精度で決定できるようになった。ただし,400塩基以上については必ずしも配列決定の精度の向上は見られず,試料やゲルの調製などに大きく依存することがわかった。実際のゲノム解析プロジェクトにこの方法を応用したときの評価も通常400塩基まで程度が限度であり,これ以上の精度の向上はゲル担体など,他の改良に依存することがわかった。
|