研究課題/領域番号 |
16K07205
|
研究機関 | 日本大学 |
研究代表者 |
中野 善夫 日本大学, 歯学部, 教授 (80253459)
|
研究分担者 |
谷口 奈央 福岡歯科大学, 口腔歯学部, 准教授 (60372885)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 菌叢解析 / 口腔内細菌 / サポートベクターマシン |
研究実績の概要 |
昨年度までに5塩基連続配列の出現頻度の偏りを指標に、4~7種の菌の混合液中の菌種の割合を推定する方法を確立したので、昨年度は同様の5塩基連続配列の偏りを用いるが、これを菌種間ではなく、ゲノムの中での偏りに注目して、外来性の遺伝子の検出を試みることにした。 細菌ゲノムの塩基の配列には種に固有の偏りがあり、数塩基の連続配列の出現頻度を調べると、菌種を識別することも可能である。この配列の偏りは一つのゲノム中にも観察される。その連続配列の異なる領域は、菌種を越えた水平伝播によって獲得された遺伝子群である可能性が考えられる。そこで、本研究ではゲノム配列中から5塩基連続配列に偏りのある領域を1クラス・サポートベクターマシン(OC-SVM)を用いて抽出し、そこに含まれる遺伝子産物について解析した。 ゲノム配列が報告されているおよそ2700種のバクテリアゲノムの塩基配列を200塩基ごとに区切り、5塩基連続配列の出現頻度を集計した。その値が周囲から異なる領域をOC-SVMを用いて判別し、その領域にどのような遺伝子が含まれているかを調べた。 この方法で抽出された領域には、遺伝子転位に係る遺伝子や転写・翻訳、細胞壁・細胞膜関連、移動性因子(プロファージ、トランスポゾン)に関係する遺伝子が際立って多かった。その他、機能がまだ報告されていない遺伝子がおよそ半数に達した。それらの遺伝子群をcd-hitを用いて共通の配列を持つもの同士でまとめてみたところ(70%以上相同性)、100種以上のゲノムに共通して存在する95の遺伝子クラスターが存在した。これらの遺伝子群は、今まで知られていなかった菌種間を伝播していく性質を備えた遺伝子であることが示唆された。 ここまでの内容を第91回日本細菌学会で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
おおむね順調に進展しているとは、本年まで計画通りに進んでいるという意味である。その理由としては、予定からの逸脱、停止、遅延、失敗等の進展を疎外する要因がない状態が続いているということ以外にはあり得ない。進展している理由ではないが付け加えるとすれば、得られた移動性遺伝子群候補の機能を解析し、その計算終了後に成果を論文として発表する準備も進めている。
|
今後の研究の推進方策 |
連続塩基配列出現頻度による解析におけるエラーの影響を検証するため、分析結果にランダムにエラーを導入した配列を用いた解析を行ない、エラーに対する強さを検証する。ランダムならば理論的には影響を受けないはずである。まず、in silicoでランダムな塩基置換を導入して、実際の計算がどのような影響を受けるかを検証する。次に、長距離が読めるがエラーが多いような解析方法を利用して、構成種推定のエラーに対する耐性を検証する。今年度はOxford Nanopore(ミナイオン)のような携帯型シーケンサーを使う。 今年度は解析の対象として、以前、口腔内の菌叢より抽出した16S rRNA配列に基づいて口臭の有無を予測したが、それを今回は5塩基連続配列の出現頻度によって予測が可能になるかどうかを検証する。福岡歯科大学口臭外来の受診者の唾液から菌を回収しDNAを精製する。メタゲノム解析を行い、その結果からヒト由来の配列を除いた後(これまでの予備的な解析から10~15%がヒト由来であることが判っている)、100塩基の断片の集合が得られる。そこから5連続塩基配列の出現頻度を集計すると、各サンプルごとに512次元のベクトルが得られる。その配列データと口臭の有無を、機械学習(SVM)や深層学習の手法を用いて学習し、未知のサンプルの口臭の有無を予測する。実際には口臭の有無の判っているサンプルを用いて、予測精度を検証する。その際に、上記のエラー耐性も調べていく予定である。
|
次年度使用額が生じた理由 |
(理由)解析サンプルの調製が年度後半になり、配列解析の報告が研究費の年度末締切りに間に合うという確証が得られなかったので、次年度初めに解析を始めることにしたため。 (使用計画) 30年度助成金と合わせて、口腔内サンプル由来の細菌叢メタゲノム解析を順次進めていく。
|