本研究では、研究代表者がこれまでに開発してきた統合遺伝子検索システムのうち、とくに塩基配列を効率よく検索することができるGGGenome(http://GGGenome.dbcls.jp/)というソフトウェアの開発を進めた。GGGenomeは、一般的な塩基配列検索ツールでは検索の困難な20塩基未満の配列でもすばやく検索することができ、配列にN/R/Yなどあいまいな塩基を含む場合や、配列全体の4分の1程度までミスマッチや挿入欠失を含む配列であっても、見落としなく検索することができる。塩基配列が公開されている200種以上の生物のゲノムや、RefSeqに収録された転写産物、さらにはINSD国際塩基配列データベース上の全塩基配列を検索できるようにした。また、外部のソフトウェアやデータベースとの連携を容易にするため、REST APIを整備した。 さらに、GGGenomeによる塩基配列検索が役立つ応用例を検討した。CRISPR/Cas9ゲノム編集法におけるガイドRNAの設計がその一例である。CRISPR/Cas9法では、標的とする部位以外のゲノムを誤って認識してしまうオフターゲット効果を防ぐため、ゲノム全体の塩基配列を検索し、ゲノムのほかの領域とは配列類似性の低い領域に対しガイドRNAを設計する必要がある。このような検索は従来の塩基配列検索ツールでは困難であったが、GGGenomeを用いることにより容易となった。前述のGGGenomeのAPIを活用することにより、ゲノム編集のためのガイドRNA設計ソフトウェアCRISPRdirect(http://crispr.dbcls.jp/)を開発し公開した。さらに、核酸医薬品のオフターゲット効果の予測にも、GGGenomeが有効であることがわかった。 本研究の成果はウェブツールとして無償で公開し、すべての研究者が自由に活用できるようにした。
|