• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

MAFFT多重アラインメントプログラムの大量配列データへの対応と機能拡張

Research Project

Project/Area Number 16K07464
Research InstitutionOsaka University

Principal Investigator

加藤 和貴  大阪大学, 免疫学フロンティア研究センター, 特任准教授(常勤) (70378868)

Co-Investigator(Kenkyū-buntansha) 山田 和範  東北大学, 情報科学研究科, 助教 (20756217)
富井 健太郎  国立研究開発法人産業技術総合研究所, その他部局等, 研究員 (40357570)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywords多重配列アラインメント / 配列解析 / タンパク質 / 塩基配列 / 相同性検索
Outline of Annual Research Achievements

本研究は多重配列アラインメントプログラムMAFFTの適用範囲の拡大を目的とする。
1. 配列決定技術の進歩にともなって、アラインメントに含める必要のある配列の数が増加している。巨大アラインメントを累進法によって構築するためにどのような案内木が適しているか検討した。Boyce et al. (2014) によって、多数の配列からなるアラインメントを構築する時は、従来よく使われてきた案内木に比べてより簡単な、ランダムに生成した鎖状案内木がよい結果を与えることが報告された。これは30年来信じられてきた、配列の間の系統関係を考慮することによってより良いアラインメントが得られるはずという前提を疑わせる結果であり、反論もある (Tan et al. 2015)。そこで、再現実験と、彼らとは異なる条件での実験を慎重に行った。ランダムに生成した鎖状案内木が最善の選択肢なのか、計算量が多くより厳密に推定した案内木がより良い結果を与えるのか調べた。その結果、より厳密な方法で案内木を求めた方が良いという、従来の考えを支持する結果が得られた。議論になっていた点だったので、この結果を Yamada et al. (2016) で報告した。ここで試した厳密な方法は、既にMAFFTプログラムに実装されていたものであったが、巨大アラインメントに適用することを想定していなかったので、メモリ使用量と計算時間の面で実用的ではなかった。そのため、技術的な改良によってこの方法を巨大アラインメントに適用可能にすることを次年度の目標とする。
2. アラインメント計算の際に、相同でない座位を合わせてしまう危険が存在することが指摘されている。それを緩和する方法を Katoh & Standley (2016) において報告した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

Yamada et al. (2016) で行ったテストによって、既にMAFFTプログラムに実装されていた方法 (G-INS-1 オプション) が良い結果を与えることがわかった。この点は、別のグループによって今年報告された結果とも整合的である (Le et al. 2017)。この方法を巨大アラインメントに適用することは想定していなかったため、メモリ使用量と計算時間の面で実用的ではなかった。そのため短期的な目標を、技術的な改良によってこの方法を巨大アラインメントに適用可能にすること、とする。

Strategy for Future Research Activity

今年度は、MPIライブラリを用いた並列化によって、G-INS-1 オプションを巨大アラインメントに適用可能にする。100,000本程度を想定している。メモリ使用量の問題は、RAM上で処理しているデータを一時ファイルに書き出すことによって回避する。ただし、ファイルへのアクセス速度はRAMに比べて遅いので、技術的な工夫が必要である。第一に、データのファイルへの書き出しと読み込みが同一の順番で行われるように計算手順を変更し、ランダムアクセスを行わないようにする。第二に、最近普及しつつある高速な分散ファイルシステムを使用する。
並行して、ウェブサービスで使っているJava Applet のJavascript への切り替え、配列の類似性に応じた複数のスコアリングマトリクスの利用、遠縁の配列の検出のための多重配列アラインメント、局所的信頼性の評価などを、従来の計画通り次年度から最終年度にかけて行う。

Causes of Carryover

打合せの一部を、別の出張の時に行ったり、メールで済ませたりしたため。

Expenditure Plan for Carryover Budget

外部の計算サービスの利用料に用いる。

  • Research Products

    (3 results)

All 2016 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results,  Acknowledgement Compliant: 1 results) Remarks (1 results)

  • [Journal Article] Application of the MAFFT sequence alignment program to large data―reexamination of the usefulness of chained guide trees2016

    • Author(s)
      Yamada KD, Tomii K, Katoh K
    • Journal Title

      Bioinformatics

      Volume: 32 Pages: 3246-3251

    • DOI

      10.1093/bioinformatics/btw412

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] A simple method to control over-alignment in the MAFFT multiple sequence alignment program2016

    • Author(s)
      Katoh K, Standley DM
    • Journal Title

      Bioinformatics

      Volume: 32 Pages: 1933-1942

    • DOI

      10.1093/bioinformatics/btw108

    • Peer Reviewed / Open Access
  • [Remarks] MAFFT - a multiple sequence alignment program

    • URL

      http://mafft.cbrc.jp/alignment/server/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi