2020 Fiscal Year Annual Research Report
Extension of MAFFT multiple sequence alignment program mainly for large data
Project/Area Number |
16K07464
|
Research Institution | Osaka University |
Principal Investigator |
加藤 和貴 大阪大学, 微生物病研究所, 准教授 (70378868)
|
Co-Investigator(Kenkyū-buntansha) |
山田 和範 東北大学, 情報科学研究科, 准教授 (20756217)
富井 健太郎 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究チーム長 (40357570)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | ウイルスゲノム / タンパク質立体構造 / 巨大アラインメント |
Outline of Annual Research Achievements |
2020年度は、コロナウイルスゲノム配列の解析にMAFFTプログラムがよく利用された (Collier et al 2021 Nature; Tegally et al 2021 Nature; Kemp et al 2021 Nature など)。そのため大阪大学で行っている計算サービスが慢性的に混雑しているので、この需要に応えることに注力した。この問題のように類似度が高く配列が長い場合の大域的アラインメントは難しい問題ではなく、通常の多重配列アラインメントより簡単なアルゴリズムで充分役に立つので、そのようなサービスを開始した。 https://mafft.cbrc.jp/alignment/server/add_fragments.html 研究期間全対を通して、以下の成果を得た。(1) Katoh & Standley (2016 Bioinformatics) において、合わせすぎ問題を抑制する方法を提案した。(2) Yamada et al. (2016 Bioinformatics) は、大規模アラインメントの正確さに対するいくつかのテクニックの効果を評価し、全ペアのダイナミックプログラミングによるアラインメントが有用であることを示した。しかし、その計算は通常のパーソナルコンピュータでは難しいため、(3) Nakamura et al. (2018 Bioinformatics) で、大規模な並列計算機によってコストの高い計算を実行可能にした。(4) Rozewicki et al. (2019 NAR) は、立体構造の利用によって多重配列アラインメントの正確さを向上させた。利用可能な立体構造の数は配列に比べて限られていることと、構造アラインメントのための計算コストは高いため、必要なペアの構造アラインメントをあらかじめ計算しておきデータベースとしてまとめ、必要なときに利用するという方針をとった。(5) Katoh, Rozewicki, Yamada (2019 Briefings in Bioinformatics) は、本計画で開発したMAFFTウェブサービスの全体を記述した。 以上の5報の論文のうち4報が、Web of Scienceにおいて引用数上位1%にランクされた。Katoh et al (2019) は上位0.1%にもランクされた。
|
Research Products
(5 results)