2020 Fiscal Year Research-status Report
短鎖連続塩基配列に基づく細菌ゲノム・菌叢解析と機械学習による口臭予測への応用
Project/Area Number |
20K12068
|
Research Institution | Nihon University |
Principal Investigator |
中野 善夫 日本大学, 歯学部, 教授 (80253459)
|
Co-Investigator(Kenkyū-buntansha) |
谷口 奈央 福岡歯科大学, 口腔歯学部, 准教授 (60372885)
渡辺 孝康 日本大学, 歯学部, 助教 (70725514)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 系統樹 / ゲノム |
Outline of Annual Research Achievements |
口臭予測のための試料として、本年度は福岡歯科大学口臭クリニックで150程度を目標に唾液サンプルを集める予定だったが、新型コロナウイルス感染拡大に伴いクリニック受診者が激減し、目標に遠く及ばなかった。その後、やや持ち直してきているので、今後サンプル採取を進める予定である。 口臭サンプルの必要のない「識別困難菌種の系統解析と種判別器の確立」については、RスクリプトとShinyを用いてオンラインで5塩基連続配列の出現頻度に基づき系統樹解析を行えるプログラムを構築し、広く利用できる環境を整えることができた。Bioinformatics誌に論文を投稿し、現在審査結果を待っているところである。論文が受理されたらそのURLを公開する予定である。E. coli/ShigellaやYersinia属細菌で短時間に系統樹を作成できるようになり、その結果も精度の良いものとなっている。 「水平伝播により得られた遺伝子の推定」については、共生細菌遺伝子を多数取り入れたといわれる昆虫であるアブラムシのゲノム配列中から、5塩基配列出現頻度に偏りのある領域を抽出して、細菌ゲノムデータベストの照合を行って、5塩基出現頻度が平均的である領域との比較を行っている。1クラスサポートベクターマシンでの抽出に計算機の演算処理能力を追いつかず、数ヶ月掛かることが判ったので、5塩基配列出現頻度の分散値の比較によって偏りのある領域を抽出した。今後、カイガラムシを含む他の細菌遺伝子を取り込んだと報告されている昆虫、さらにそのような取り込みがなさそうな昆虫ゲノムとの比較を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
「口腔内細菌叢のN個連続塩基配列解析による口臭の有無の予測」については、新型コロナウイルス感染の拡大に伴い福岡歯科大学口臭クリニックの来院者数が激減したために進捗は大きく遅れている。現在は若干上向いてきているものの、今後変異株の大流行が発生すればさらに遅れる可能性はある。これは申請者らの努力や工夫ではどうにもできないので事態を見守るしかない。 「識別困難菌種の系統解析と種判別器の確立」は順調に進み、RによるプログラムをオンラインでGUIとして動かす形にすることができた。論文が受理されれば広く一般公開することが可能である。Support vector machineを利用した菌種判別器のGUI化と公開を残すだけである。 「水平伝播により得られた遺伝子の推定」は、昨年度新型コロナウイルス対応のために解析時間が予定どおり確保できず若干の遅れが生じている。5塩基配列出現頻度の分布を調べ、周辺と異なる領域の抽出には異常値の検出に用いられるOC-SVMを採用する予定であったが、昆虫1種のゲノムの解析に3ヶ月ほどを要することが判り、5塩基配列出現頻度数の不偏分散の値を用いて、全ゲノム中の平均値から512次元の標準ベクトルを定め、それと作る角度が大きい領域、すなわち平均的出現頻度と大きく異なる領域を抽出するという方法に変更して遅れを取り戻しつつあるところである。 「目的に応じた連続塩基数の決定」の項目にはまだ着手していないが、これは上記の内容があるていど進展してからでなければ進められない領域であるので、予定通りである。
|
Strategy for Future Research Activity |
今年度は「口腔内細菌叢のN個連続塩基配列解析による口臭の有無の予測」のためのサンプル採取を進め、配列解析へと進める。感染爆発によって再度塩基を余儀なくされたら最終年度にまとめて配列解析を行う。 「識別困難菌種の系統解析と種判別器の確立」は、系統樹解析のオンライン公開を予定通り行い、さらにSVMを利用した菌種判別機能の附与まで進める。 「水平伝播により得られた遺伝子の推定」ではワタアブラムシAphis gossypii(Wolbachia属細菌を共生細菌として保有している)のゲノム塩基配列を使って、5塩基配列出現頻度による特異領域の抽出の手順は確立したので、細菌ゲノムとの参照作業を進めるとともに、他の昆虫のゲノムとの比較をしながら、方法の確立を進めていく予定である。共生細菌の多い、カイガラムシやカメムシ、さらに共生細菌が異なる(あるいはいない)昆虫と比べて、ゲノム中の特異領域の検出法とバクテリアゲノム中の遺伝子との比較をさらに進めていく予定である。 以上の解析を進めながら、現在5塩基の配列で解析している塩基数を変化させ効率のよい解析に適した塩基数を求めていくことにする。塩基数が増えれば計算量が指数関数的に増えていくので、必要最小の塩基数が最適な塩基数となる。バクテリアの系統解析では5塩基がよいことがすでに明らかになっているが、解析の目的が異なれば最適塩基数も変わってくると考えられるからである。
|
Causes of Carryover |
福岡歯科大学口臭クリニックの来院者数が新型コロナウイルス感染によって激減したために、塩基配列解析を今年度に先送りせざるを得なくなった。今年度はある程度のサンプル採取が見込まれるので、塩基配列解析を行いその費用を計上する予定である。
|