研究課題/領域番号 |
18K08431
|
研究機関 | 大阪大学 |
研究代表者 |
元岡 大祐 大阪大学, 微生物病研究所, 特任助教(常勤) (10636830)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | メタゲノム |
研究実績の概要 |
本研究は、原因不明疾患の患者の臨床検体から網羅的かつ迅速な病原体の検出・同定を行い、感染症の原因を解明することを目的とする。取り組む次世代シークエンサーを用いたメタゲノム解析法(クリニカルメタゲノミクス)は、病原体ごとに異なる処理は必要とせず、臨床検体中の遺伝情報を網羅的に探索することで、すべての既知の病原体はもちろん、未知の病原体をも検出・同定し得るものである。さらに全核酸の配列をシークエンスしているので、病原体の検出と同時に病原体ゲノムの遺伝子型のタイピングも実施可能である。 しかし、本手法では、臨床検体中の核酸配列を網羅的に解読するため、得られるデータ量は、検体中に存在する生物のゲノムサイズとそのコピー数の積に比例する。そのため、ゲノムサイズの小さなウイルスや細菌など病原性微生物由来の配列は、メタゲノムデータにおいて、その配列数がごくわずかとなる。また大量に得られるメタゲノムデータ中には、ライブラリ調製過程でのキメラ配列や試薬に由来する配列など不要な情報も多く含まれる。そこで本研究では、病原体の検出感度向上と低コスト化、解析の高速化に向けて、主に臨床検体中における病原体の濃縮法について開発を行う。本年度は、これまでに取得済みのデータを用いて解析の高速化に向けた解析パイプラインの最適化に取り組んだ。具体的には、NGSのライブラリ調製時に付加したアダプター配列がゲノムアセンブリの際にミスアセンブリにより組み込まれ、データベース上に誤登録されているものを検出したり、特定の試薬を用いた場合によく検出される病原体由来の配列断片を検出したりした。また、ゲノムとの類似性ゆえ誤検出されやすい(偽陽性となりやすい)配列もまとめあげ、それらをデータベース化することで、解析の最適化を実施した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は、メタゲノム解析の高速化に向けたデータベースと解析手法の最適化に取り組んだ。メタゲノム解析の一般的な解析ワークフローとしては、得られた配列のトリミング、マッピングなどによるホスト由来核酸の除去、残る配列に対するデータベー スとの相同性検索などであるが、最初の工程におけるトリミングの最適化を実施した。解析時に偽陽性となったり、データベース上へ誤登録されたりしている配列をまとめて、データベース化し、既存の解析パイプラインの初期工程に組み込んだ。具体的には、アダプタートリミングやクオリティトリミングの後に本工程を実施するようにした。不要な配列の除去方法としては、シークエンスによって得られた配列との相同性が高いため、bwaを用いたマッピングにより実施することとし、高速に処理ができるように整えた。病原体検出専用のデータベースを用いたマッピング解析と組み合わせて実施することで、計算時間のかかる相同性検索(BLAST検索)に要する時間を減らすことに成功した。
|
今後の研究の推進方策 |
臨床検体のメタゲノムデータ解析の高速化に向けた取り組みは、概ね順調に進めることができたが、実際にメタゲノムデータ中に含まれる病原体由来の核酸配列は0.1%を下回ることが多く、膨大なシークエンスデータ中の大部分が病原体由来配列ではないため、コストに無駄があるというだけでなく、不要なホスト由来核酸にリードが専有されるために感度が低いという課題が残っている。次年度以降は、高感度化を目指した病原体核酸の効率的なシークエンス方法の検討に取り組むこととする。これまでに実施してきたカラムによるウイルス濃縮方法を発展させ、より効率的な濃縮方法を検討すると共に、細菌・真菌・寄生虫といった他の病原性微生物に対する濃縮方法を検討していきたい。また同時に無駄なデータとなっているホスト由来の配列にも特徴づけを行いたい。特定の遺伝子が多くシークエンスされているのであれば、解析時にそれらをすばやく除去することは可能であるし、プローブを用いたり、配列の特徴性を活かしたりすることで、ライブラリ調製時にホスト由来の核酸を減らす方法を検討できる可能性がある。
|
次年度使用額が生じた理由 |
臨床検体由来の核酸配列から病原性微生物に由来する配列を濃縮するための手法について種々の検討を行う予定であったが、カラムによる濃縮条件の検討に想定以上の時間を要した。そのため、本年度実施予定であった、濃縮条件の最適化や次世代シーケンサーを用いた研究については次年度以降に実施する予定である。
|