天然物は医薬品をはじめとする様々な機能性材料の源であり、その生合成経路を理解することは、合成生物学的アプローチにより、その効果的な生産に役立つ情報を提供することができる。これまでに、化学構造から生合成経路を逆合成的に予測しようとする研究が数多く行われてきたが、目的の分子から出発物質に到達しないまま計算が終了してしまうことがあった。この問題を解決するためには、適切な出発物質を見つける方法が必要である。
本研究では、標的分子の構造を、生合成経路の出発物質に対応する部分構造である生合成単位(BU)に自動的に分解する予測ワークフロー「メタボリック・ディスアセンブラ」を開発した。本ワークフローでは、出発物質、主要中間体、およびそれらの誘導体を含む生合成単位ライブラリ(BUL)を使用した。KEGG PATHWAY データベースから出発物質を取得し、765 個の BU を BUL に登録した。次に提案したワークフローを検討して、BUの組み合わせの最適化を試みた。提案ワークフローの性能を評価するために、KEGG PATHWAYの二次代謝マップに含まれる943個の分子を用いた。その結果、約95.8%の903分子が正しく分解された。比較のために遺伝的アルゴリズムを用いたワークフローも実施したが、その精度は約 52.0%であった。また、90.7%の分子については、1 分以内に計算を終えることができた。
メタボリック・ディスアセンブラは、正しさと計算時間の両面で天然物の効率的な分解を可能にしました。また、ユーザーが計算結果を理解しやすいように、BNに対応する部分構造を自動的に色分けして出力します。利用者は、出発分子を事前に指定する必要がなく、データベースにない分子であっても、任意のターゲット分子を入力することができます。このワークフローは、天然物の生合成の理解や予測に大いに役立つと考えています。
|