Publicly Offered Research
Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
本研究では、メタゲノムデータから高精度に機能未知遺伝子の機能を予測するために、(1) All- to-all free 法による超高速オーソログ推定ソフトウェアの開発 (2) Graphical Lasso 法を用いた高 精度メタゲノム系統プロファイル法の開発、という 2 点について研究を行う。
本年度は、大規模ゲノム・メタゲノムデータセットに対してスケッチソートを用いて高速にオーソログ推定を行うプログラムの開発を試みた。しかしながら当初予定していたアルゴリズムは、既存の手法に比べてわずかに高速であったものの、精度が大きく下がったため、実用に耐えるアルゴリズムではないと判断したため、研究計画を大きく変更することとなった。まず開発を予定していたアルゴリズムの副産物として、深層学習を用いてRNA二次構造accessibilityを高速に予測するソフトウェアを開発したところ、既存手法と高い相関を得ながらも100倍程度高速であり十分に実用に耐えるプログラムが開発できた。本研究は既に論文発表済みである。また、シアノバクテリアゲノムデータセットに対してオーソログ推定・系統プロファイル解析を行い、フィコビリソームと有意に関連すると目される遺伝子を発見した。変異株作成実験により、その遺伝子の機能を実験的に検証したところ、本遺伝子はフィコビリソームのステート遷移と呼ばれる機能と関連することを明らかとした。現在、本研究については論文投稿中である。
3: Progress in research has been slightly delayed.
当初開発を予定していたアルゴリズムは、実用に耐える十分な性能を発揮できないことが研究の結果明らかとなったため。
シアノバクテリアの系統プロファイル解析によって、フィコビリソームに関連する機能未知遺伝子を検出し、実験的にその機能を検証した。今後、その分子生物学的・生化学的な機能をより探索するとともに、他生物に広く保存されていながらも機能が十分に知られていないタンパク質であることから、その系統関係や分布など進化的な関係について研究を進める。
All 2023
All Journal Article (1 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (2 results)
Frontiers in Bioinformatics
Volume: 3 Pages: 1275787-1275787
10.3389/fbinf.2023.1275787