• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

MAFFT多重アラインメントプログラムの大量配列データへの対応と機能拡張

研究課題

研究課題/領域番号 16K07464
研究機関大阪大学

研究代表者

加藤 和貴  大阪大学, 免疫学フロンティア研究センター, 特任准教授(常勤) (70378868)

研究分担者 山田 和範  東北大学, 情報科学研究科, 助教 (20756217)
富井 健太郎  国立研究開発法人産業技術総合研究所, その他部局等, 研究員 (40357570)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード多重配列アラインメント / 配列解析 / タンパク質 / 塩基配列 / 相同性検索
研究実績の概要

本研究は多重配列アラインメントプログラムMAFFTの適用範囲の拡大を目的とする。
1. 配列決定技術の進歩にともなって、アラインメントに含める必要のある配列の数が増加している。巨大アラインメントを累進法によって構築するためにどのような案内木が適しているか検討した。Boyce et al. (2014) によって、多数の配列からなるアラインメントを構築する時は、従来よく使われてきた案内木に比べてより簡単な、ランダムに生成した鎖状案内木がよい結果を与えることが報告された。これは30年来信じられてきた、配列の間の系統関係を考慮することによってより良いアラインメントが得られるはずという前提を疑わせる結果であり、反論もある (Tan et al. 2015)。そこで、再現実験と、彼らとは異なる条件での実験を慎重に行った。ランダムに生成した鎖状案内木が最善の選択肢なのか、計算量が多くより厳密に推定した案内木がより良い結果を与えるのか調べた。その結果、より厳密な方法で案内木を求めた方が良いという、従来の考えを支持する結果が得られた。議論になっていた点だったので、この結果を Yamada et al. (2016) で報告した。ここで試した厳密な方法は、既にMAFFTプログラムに実装されていたものであったが、巨大アラインメントに適用することを想定していなかったので、メモリ使用量と計算時間の面で実用的ではなかった。そのため、技術的な改良によってこの方法を巨大アラインメントに適用可能にすることを次年度の目標とする。
2. アラインメント計算の際に、相同でない座位を合わせてしまう危険が存在することが指摘されている。それを緩和する方法を Katoh & Standley (2016) において報告した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

Yamada et al. (2016) で行ったテストによって、既にMAFFTプログラムに実装されていた方法 (G-INS-1 オプション) が良い結果を与えることがわかった。この点は、別のグループによって今年報告された結果とも整合的である (Le et al. 2017)。この方法を巨大アラインメントに適用することは想定していなかったため、メモリ使用量と計算時間の面で実用的ではなかった。そのため短期的な目標を、技術的な改良によってこの方法を巨大アラインメントに適用可能にすること、とする。

今後の研究の推進方策

今年度は、MPIライブラリを用いた並列化によって、G-INS-1 オプションを巨大アラインメントに適用可能にする。100,000本程度を想定している。メモリ使用量の問題は、RAM上で処理しているデータを一時ファイルに書き出すことによって回避する。ただし、ファイルへのアクセス速度はRAMに比べて遅いので、技術的な工夫が必要である。第一に、データのファイルへの書き出しと読み込みが同一の順番で行われるように計算手順を変更し、ランダムアクセスを行わないようにする。第二に、最近普及しつつある高速な分散ファイルシステムを使用する。
並行して、ウェブサービスで使っているJava Applet のJavascript への切り替え、配列の類似性に応じた複数のスコアリングマトリクスの利用、遠縁の配列の検出のための多重配列アラインメント、局所的信頼性の評価などを、従来の計画通り次年度から最終年度にかけて行う。

次年度使用額が生じた理由

打合せの一部を、別の出張の時に行ったり、メールで済ませたりしたため。

次年度使用額の使用計画

外部の計算サービスの利用料に用いる。

  • 研究成果

    (3件)

すべて 2016 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件、 謝辞記載あり 1件) 備考 (1件)

  • [雑誌論文] Application of the MAFFT sequence alignment program to large data―reexamination of the usefulness of chained guide trees2016

    • 著者名/発表者名
      Yamada KD, Tomii K, Katoh K
    • 雑誌名

      Bioinformatics

      巻: 32 ページ: 3246-3251

    • DOI

      10.1093/bioinformatics/btw412

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] A simple method to control over-alignment in the MAFFT multiple sequence alignment program2016

    • 著者名/発表者名
      Katoh K, Standley DM
    • 雑誌名

      Bioinformatics

      巻: 32 ページ: 1933-1942

    • DOI

      10.1093/bioinformatics/btw108

    • 査読あり / オープンアクセス
  • [備考] MAFFT - a multiple sequence alignment program

    • URL

      http://mafft.cbrc.jp/alignment/server/

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi