本年度は、大規模ゲノム・メタゲノムデータセットに対してスケッチソートを用いて高速にオーソログ推定を行うプログラムの開発を試みた。しかしながら当初予定していたアルゴリズムは、既存の手法に比べてわずかに高速であったものの、精度が大きく下がったため、実用に耐えるアルゴリズムではないと判断したため、研究計画を大きく変更することとなった。まず開発を予定していたアルゴリズムの副産物として、深層学習を用いてRNA二次構造accessibilityを高速に予測するソフトウェアを開発したところ、既存手法と高い相関を得ながらも100倍程度高速であり十分に実用に耐えるプログラムが開発できた。本研究は既に論文発表済みである。また、シアノバクテリアゲノムデータセットに対してオーソログ推定・系統プロファイル解析を行い、フィコビリソームと有意に関連すると目される遺伝子を発見した。変異株作成実験により、その遺伝子の機能を実験的に検証したところ、本遺伝子はフィコビリソームのステート遷移と呼ばれる機能と関連することを明らかとした。現在、本研究については論文投稿中である。
|