2023 Fiscal Year Annual Research Report
Prediction and analysis of natural product biosynthetic clusters which cannot be predicted by conventional methods
Publicly Offered Research
Project Area | Systems biosynthetics based on accumulation, prediction, and creation of biological reactions |
Project/Area Number |
23H04561
|
Research Institution | Kitasato University |
Principal Investigator |
堤 隼馬 北里大学, 感染制御科学府, 特任助教 (40903274)
|
Project Period (FY) |
2023-04-01 – 2025-03-31
|
Keywords | 天然物 / 二次代謝産物 / 生合成遺伝子クラスター / バイオインフォマティクス |
Outline of Annual Research Achievements |
天然物生合成遺伝子クラスター (BGC) は天然物の合成を担う遺伝子群であり、BGCを見出すことが天然物探索や生合成解析において非常に重要である。そのため、様々なBGC解析ツールが開発されているが、これらはペプチドやポリケタイド系天然物のBGCなどを見出すことを得意としているため、これらのツールでは見出すことが困難なBGCも多く存在している。そこで、本研究では既存手法では見出すことが困難なBGCを見出す手法の開発を試みる。また、開発した手法により見出した生合成遺伝子クラスターの機能解析も試みる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究では、既存の手法では見出すことができない生合成遺伝子クラスターを特定するためのバイオインフォマティック的な手法の開発に着手した。まず、最初にゲノム配列のfastaファイルからアノテーションの付与、ゲノム中の全タンパク質のアミノ酸配列情報の取得、ゲノム中のアミノ酸配列のデーターベース化を一気に行うためのプログラムを構築した。さらに、
1株vs他の放線菌でタンパク質情報の比較を行い、比較にかかる計算コストについての検討を行った。情報を圧縮しない場合、1株に対してかなりの時間がかかることが明らかになった。そのため、計算コストを削減する工夫が必要であることが明らかになった。
|
Strategy for Future Research Activity |
今後は、最初にドメイン情報を特徴量とした機械学習を行うことにより既存手法では見出すことができないクラスターを同定するツールが確立できるかを試す。具体的には、既存の生合成遺伝子クラスター (既存のツールで特定できない生合成遺伝子クラスターの情報を含む) の情報を利用して行う。また、同時に比較ゲノムによる探索も行う。これらの手法により見出された生合成遺伝子クラスター (既存手法では見出すことができない) の機能を解析することにより、ツールの有用性を調べる。
|