• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

Extension of MAFFT multiple sequence alignment program mainly for large data

Research Project

Project/Area Number 16K07464
Research InstitutionOsaka University

Principal Investigator

加藤 和貴  大阪大学, 微生物病研究所, 准教授 (70378868)

Co-Investigator(Kenkyū-buntansha) 山田 和範  東北大学, 情報科学研究科, 准教授 (20756217)
富井 健太郎  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究チーム長 (40357570)
Project Period (FY) 2016-04-01 – 2021-03-31
Keywordsウイルスゲノム / タンパク質立体構造 / 巨大アラインメント
Outline of Annual Research Achievements

2020年度は、コロナウイルスゲノム配列の解析にMAFFTプログラムがよく利用された (Collier et al 2021 Nature; Tegally et al 2021 Nature; Kemp et al 2021 Nature など)。そのため大阪大学で行っている計算サービスが慢性的に混雑しているので、この需要に応えることに注力した。この問題のように類似度が高く配列が長い場合の大域的アラインメントは難しい問題ではなく、通常の多重配列アラインメントより簡単なアルゴリズムで充分役に立つので、そのようなサービスを開始した。
https://mafft.cbrc.jp/alignment/server/add_fragments.html
研究期間全対を通して、以下の成果を得た。(1) Katoh & Standley (2016 Bioinformatics) において、合わせすぎ問題を抑制する方法を提案した。(2) Yamada et al. (2016 Bioinformatics) は、大規模アラインメントの正確さに対するいくつかのテクニックの効果を評価し、全ペアのダイナミックプログラミングによるアラインメントが有用であることを示した。しかし、その計算は通常のパーソナルコンピュータでは難しいため、(3) Nakamura et al. (2018 Bioinformatics) で、大規模な並列計算機によってコストの高い計算を実行可能にした。(4) Rozewicki et al. (2019 NAR) は、立体構造の利用によって多重配列アラインメントの正確さを向上させた。利用可能な立体構造の数は配列に比べて限られていることと、構造アラインメントのための計算コストは高いため、必要なペアの構造アラインメントをあらかじめ計算しておきデータベースとしてまとめ、必要なときに利用するという方針をとった。(5) Katoh, Rozewicki, Yamada (2019 Briefings in Bioinformatics) は、本計画で開発したMAFFTウェブサービスの全体を記述した。
以上の5報の論文のうち4報が、Web of Scienceにおいて引用数上位1%にランクされた。Katoh et al (2019) は上位0.1%にもランクされた。

  • Research Products

    (5 results)

All 2021 2020 Other

All Journal Article (2 results) Book (1 results) Remarks (2 results)

  • [Journal Article] lamassemble: Multiple Alignment and Consensus Sequence of Long Reads2020

    • Author(s)
      Frith Martin C.、Mitsuhashi Satomi、Katoh Kazutaka
    • Journal Title

      Multiple Sequence Alignment (Methods in Molecular Biology)

      Volume: 2231 Pages: 135~145

    • DOI

      10.1007/978-1-0716-1036-7_9

  • [Journal Article] Analysis of Protein Intermolecular Interactions with MAFFT-DASH2020

    • Author(s)
      Rozewicki John、Li Songling、Katoh Kazutaka、Standley Daron M.
    • Journal Title

      Multiple Sequence Alignment (Methods in Molecular Biology)

      Volume: 2231 Pages: 163~177

    • DOI

      10.1007/978-1-0716-1036-7_11

  • [Book] Multiple Sequence Alignment (Methods in Molecular Biology)2021

    • Author(s)
      Kazutaka Katoh ed.
    • Total Pages
      321
    • Publisher
      Springer
    • ISBN
      978-1-0716-1035-0
  • [Remarks] 多重配列アラインメント計算サービス

    • URL

      https://mafft.cbrc.jp/alignment/server/

  • [Remarks] DASH database

    • URL

      https://sysimm.org/dash/

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi