研究課題/領域番号 |
22H01620
|
配分区分 | 補助金 |
研究機関 | 東北大学 |
研究代表者 |
大村 達夫 東北大学, 未来科学技術共同研究センター, 名誉教授 (30111248)
|
研究分担者 |
佐野 大輔 東北大学, 工学研究科, 教授 (80550368)
渡辺 幸三 愛媛大学, 沿岸環境科学研究センター, 教授 (80634435)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 機械学習 / 下水 / ウイルス |
研究実績の概要 |
テーマ1 下水からの病原ウイルスゲノムの網羅的で効率的な新規回収技術の開発 令和4年度は、下水からのウイルス回収方法の検討、および下水から回収したウイルス遺伝子の配列解析手法の構築に取り組んだ。新型コロナウイルスをモデルウイルスとして用い、下水から新型コロナウイルスのスパイクタンパク質遺伝子をPCRにより増幅するプライマーを新たに設計し、得られたPCR産物の遺伝子配列を次世代シーケンス解析により分析する一連のプロトコルを構築した。その結果、複数の変異株を含む新型コロナウイルス由来遺伝子配列を下水から取得することに成功した。
テーマ2 未知ウイルスと既知ウイルス変異株の人への感染性を評価する機械学習モデルの開発 下水から検出された多様なウイルスのゲノム配列情報に基づいて、それぞれのウイルスが感染できる動物を同定する機械学習モデルの開発に着手した。 本年度は、まずウイルスと宿主の相互作用を予測するための半教師付き機械学習モデルのアルゴリズムについて検討した。具体的には、BioPython SeqUtils Protein Analysisや社内スクリプトなどのモジュールから計算された特徴を、各対象遺伝子に対して使用するアプローチを試みた。モデルの偏りを避け、一般性を高めるために、トレーニングデータゲノム全体で分散の大きい約200の特徴を選択する。トレーニング、テスト、検証にはTSVMモデルとその教師型であるSVMを使用して、ハイパーパラメータは偽陽性を避けるために手動で微調整した。この実行はOptuna v.0.9 Bayesian optimization frameworkを使用した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
二つのテーマについて、それぞれ実施計画に沿っておおむね順調に研究を遂行することができた。
|
今後の研究の推進方策 |
テーマ1(下水からの病原ウイルスゲノムの網羅的で効率的な新規回収技術の開発)では、濃縮下水からウイルスに由来する核酸を選択的に抽出・精製し、ヒト感染性に関与するゲノム特性を検知するために、次世代シーケンシング解析の適用を試みる。 テーマ2(未知ウイルスと既知ウイルス変異株の人への感染性を評価する機械学習モデルの開発)では、最適な機械学習アルゴリズムの探索を継続すると共に、ゲノムを構成する塩基、コドン、アミノ酸に関する頻度以外のパラメータも追加してゲノム特性の把握を試みる。
|