今年度は基本システムの構築と転移遺伝子の検出を進めてきた。相同性検索のためのデータベースの準備については、既存のもので問題ないことを確認した。昆虫核ゲノムの塩基配列情報の準備に関しては、ゲノムアセンブル後のデータから自動的に行うことができるシステムを構築した。遺伝子予測までできれば理想であったが、今回の目的にあった予測は難しく、現時点では予測をせず全ゲノムDNAの塩基配列を利用することとした。断片化したゲノム配列を用い、全ゲノムの網羅的な相同性検索については、予定通り断片化、相同性検索を自動的に行いデータを収集することができるようになった。細菌のタンパク質と類似した塩基配列の抽出については、単純な相同性検索で得られたスコアを元にした抽出はできるようになった。 現在は遺伝子のサイズレベルでの検出を行っている。得られた結果を検証したところと細菌のタンパク質と高い相同性を示す領域はDNA上で連なって存在する場合が多かった。contigレベルでも検出できるしくみがあると、その後の解析が進めやすいことがわかってきた。 複数の細菌のタンパク質により類似する塩基配列を抽出できた。現在その検証を進めている。特にツエツエバエのデータは既に水平転移に由来する断片が、他のグループにより実験的にも同定されているので、その結果と上記の手法で結果を比較して、上記の方法で間違いなく推定可能かどうかを検証している。 今後は計画に沿って、分子進化学的な解析も進めていく。
|