• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

ベクトル量子化による塩基配列の高速検索に関する研究

研究課題

研究課題/領域番号 21710207
研究機関東北大学

研究代表者

陳 キュウ  東北大学, 未来科学技術共同研究センター, 准教授 (00400292)

キーワードベクトル量子化 / 塩基配列 / 高速検索 / データベース / ヒストグラム特徴
研究概要

ゲノムの配列データは、DNAを構成する4種類の塩基G(グアニン)、A(アデニン)、T(チミン)、C(シトシン)で表現される文字列である。ホモロジー検索は、進化・系統分類の解析、蛋白質の機能解析などを目的とした配列解析の最も基本的な手法の一つとなっている。現在最も頑健なアルゴリズムとして、Smith-Waterman(SW)アルゴリズムがあるが、その計算を行うことは時間的に現実的ではない。遺伝子データベースのデータ量が急速に増えている現状を考えると、さらに実行時間の大幅な増加を意味する。現状では、精度と検索速度が両立できる塩基配列の高速検索法はまだ実現されていない。本研究では、必要最小限のSWアルゴリズムによるアライメント処理と組み合わせたベクトル量子化による高精度かつ高速な塩基配列の検索手法を試みた。今年度の研究成果は以下のようになる。
配列の長さ不一致の対応策として、ローカル検索手法を導入し検討した。入力塩基配列を小さいサイズの塩基配列に分割し、各々の部分配列はデータベース中の塩基配列に最も似ている部分を探し出し、そこから類似度が上がらないまで左右伸長させ、部分配列の類似度を計算する。得られた各々の類似度を組み合わせて配列の総合類似度にし、あらかじめ設定した閾値と比較し、閾値を上回る塩基配列のみに対して、必要最小限のアライメント処理を行う。ローカル検索によって、配列間の似ている部分だけを照合させるので、検索のロバスト性が図れる。提案手法の有効性を検証するため、検索範囲を減らす実験を行った。世界的な公共の塩基配列データベースであるGenBankのサブデータベースを利用し、全体853,825個(配列長400~2000)の塩基配列を全検索するのと比べ、提案手法を使って、約0.269%に当たる2301個の塩基配列を検索するだけで同じ結果が得られた。SW手法を使って塩基配列の全体検索でかかった約2時間で、提案手法は約0.52%に当たる約37.4秒で同じ結果を得ることができた。また、代表的な高速手法であるBLASTにより2.78倍速くなった。

  • 研究成果

    (4件)

すべて 2011 2010

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) 図書 (1件)

  • [雑誌論文] A Fast Search Method for DNA Sequence Database Using Histogram Information2011

    • 著者名/発表者名
      Qiu Chen
    • 雑誌名

      International Journal of Bioinformatics Research

      巻: 3 ページ: 161-166

    • 査読あり
  • [学会発表] An Improved Fast Search Method Using Histogram Features for DNA Sequence Database2010

    • 著者名/発表者名
      Qiu Chen
    • 学会等名
      The 2010 International Conference on Computer and Information Science (ICCIS 2010)
    • 発表場所
      Amsterdam, Netherlands
    • 年月日
      2010-09-29
  • [学会発表] A Local Search Method Using Histogram Features for Fast Retrieval of DNA Sequences2010

    • 著者名/発表者名
      Qiu Chen
    • 学会等名
      The 2010 International Conference of Information Engineering (ICIE 2010)
    • 発表場所
      London, U.K.
    • 年月日
      2010-07-02
  • [図書] Self-Organizing Maps2010

    • 著者名/発表者名
      Qiu Chen
    • 総ページ数
      277-288
    • 出版者
      In-Tech

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi