本研究課題の目的の一つ「識別困難菌種の系統解析と種判別器の確立」については、RスクリプトとShinyを用いてオンラインで5 塩基連続配列の出現頻度に基づき系統樹解析を行えるプログラムを構築し、広く利用できる環境を整えることができた。また、この方法でIpomoea属植物の葉緑体ゲノムを用いて系統解析を行ったところ、得られた系統樹はこれまでに報告 された形態的解析や固有の遺伝子配列を用いた系統樹と極めてよく一致したことから、細菌のみならず広い生物種を対象に近縁種の系統解析に貢献できる手法で あることが明らかとなった。この内容につては、PLOS One誌に論文が受理された。 一方、これまでに解析できた唾液サンプル中の口腔内細菌メタゲノム解析を一部行なった。ヒトゲノム配列データベースを用いて口腔内細菌ゲノムDNAサンプル中にどれくらいヒト由来のDNA断片が混入しているかを調べたところ(16サンプル)、25-80%のヒト由来塩基配列が見出された(平均49%)。まず、fastpでDNA断片の5'と3'のクオリティの低い領域のトリミングと残存しているかも知れないアダプターのトリミングと行なった後、KneadDataを使ってこの宿主ゲノム(ヒトゲノム)の除去を実施した。除去後の配列をsendsketchコマンドを使って確認してみると、そのほとんどすべてがNeissseria属細菌、Prevotella属細菌のように口腔内細菌としてよく知られている細菌由来であることが確認できた。ここで得られた配列を用いて、Megahitを使ったアセンブルを行なった。現在はこれをコンティグの分類、配列が由来するゲノムのアサイン等を行なっているところである。同時に、宿主ゲノム配列を除去した後の配列を用いて、5塩基配列出現頻度に基づく系統樹解析を行ない、口腔内細菌叢の類似度を比較することもできた。
|