2022 Fiscal Year Annual Research Report
Early detection of unknown viral mutants that potentially cause COVID-19-like pandemics using from wastewater
Project/Area Number |
22H01620
|
Allocation Type | Single-year Grants |
Research Institution | Tohoku University |
Principal Investigator |
大村 達夫 東北大学, 未来科学技術共同研究センター, 名誉教授 (30111248)
|
Co-Investigator(Kenkyū-buntansha) |
佐野 大輔 東北大学, 工学研究科, 教授 (80550368)
渡辺 幸三 愛媛大学, 沿岸環境科学研究センター, 教授 (80634435)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 機械学習 / 下水 / ウイルス |
Outline of Annual Research Achievements |
テーマ1 下水からの病原ウイルスゲノムの網羅的で効率的な新規回収技術の開発 令和4年度は、下水からのウイルス回収方法の検討、および下水から回収したウイルス遺伝子の配列解析手法の構築に取り組んだ。新型コロナウイルスをモデルウイルスとして用い、下水から新型コロナウイルスのスパイクタンパク質遺伝子をPCRにより増幅するプライマーを新たに設計し、得られたPCR産物の遺伝子配列を次世代シーケンス解析により分析する一連のプロトコルを構築した。その結果、複数の変異株を含む新型コロナウイルス由来遺伝子配列を下水から取得することに成功した。
テーマ2 未知ウイルスと既知ウイルス変異株の人への感染性を評価する機械学習モデルの開発 下水から検出された多様なウイルスのゲノム配列情報に基づいて、それぞれのウイルスが感染できる動物を同定する機械学習モデルの開発に着手した。 本年度は、まずウイルスと宿主の相互作用を予測するための半教師付き機械学習モデルのアルゴリズムについて検討した。具体的には、BioPython SeqUtils Protein Analysisや社内スクリプトなどのモジュールから計算された特徴を、各対象遺伝子に対して使用するアプローチを試みた。モデルの偏りを避け、一般性を高めるために、トレーニングデータゲノム全体で分散の大きい約200の特徴を選択する。トレーニング、テスト、検証にはTSVMモデルとその教師型であるSVMを使用して、ハイパーパラメータは偽陽性を避けるために手動で微調整した。この実行はOptuna v.0.9 Bayesian optimization frameworkを使用した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
二つのテーマについて、それぞれ実施計画に沿っておおむね順調に研究を遂行することができた。
|
Strategy for Future Research Activity |
テーマ1(下水からの病原ウイルスゲノムの網羅的で効率的な新規回収技術の開発)では、濃縮下水からウイルスに由来する核酸を選択的に抽出・精製し、ヒト感染性に関与するゲノム特性を検知するために、次世代シーケンシング解析の適用を試みる。 テーマ2(未知ウイルスと既知ウイルス変異株の人への感染性を評価する機械学習モデルの開発)では、最適な機械学習アルゴリズムの探索を継続すると共に、ゲノムを構成する塩基、コドン、アミノ酸に関する頻度以外のパラメータも追加してゲノム特性の把握を試みる。
|
Research Products
(6 results)