• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

ゲノム配列からの高次圧縮・クラスタリングによる知識発見

Research Project

Project/Area Number 13208002
Research Category

Grant-in-Aid for Scientific Research on Priority Areas (C)

Allocation TypeSingle-year Grants
Review Section Biological Sciences
Research InstitutionThe University of Tokyo

Principal Investigator

稲葉 真理  東京大学, 大学院・理学系研究科, 講師 (60282711)

Co-Investigator(Kenkyū-buntansha) 定兼 邦彦  東北大学, 大学院・情報科学研究科, 助手 (20323090)
今井 浩  東京大学, 大学院・情報理工学系研究科, 教授 (80183010)
Project Period (FY) 2000 – 2001
Project Status Completed (Fiscal Year 2001)
Budget Amount *help
¥4,000,000 (Direct Cost: ¥4,000,000)
Fiscal Year 2001: ¥4,000,000 (Direct Cost: ¥4,000,000)
KeywordsDNA配列 / ゲノム検索 / 接尾辞配列 / 圧縮接尾辞配列
Research Abstract

ゲノム計回では様々な生物のDNA配列の解読が進んでおり,さらにDNA配列中のタンパク質のコーディング領域の推定や,タンパク質の機能の予測などが行われている.また,異なる生物のDNAやアミノ酸配列の間の類似度を計算し,それによつて構造や機能の予測や,進化系統樹の解析が行われている。本研究ではこれらの問題に対する文字列の高次圧縮の研究を目指した.具体的には、文字列を圧縮したまま高速に検索するデータ構造の研究を行った.特に,様々な問題を解く際に用いることができる汎用的な索引の研究を行った.ヒトゲノム27億塩基に対して、任意のパタンを検索可能を索引である接尾辞配列のサイズは約11Gバイトであるが、それを約2Gバイトに圧縮した。索引を圧縮することでコンピュータのメモリ内に格納することが可能になり,高速検索が行える.任意のパタンの高速検索が可能な接尾辞配列の圧縮に関する研究はごく最近に始まったものであり,まだ理論的な結果のみが示されているのみである.実際に索引を構成している例もあるが,データ量はあまり大きくない.本研究では大量のデータに対して実際に索引を作成している.圧縮された索引を用いて配列を検索する場合・圧縮されていない索引を用いた場合と同じアルゴリズムを使えるが,アルゴリズムによっては速度が低下する場合がある.また,索引生成時に必要なメモリ量が大きいため,索引の生成にはスーパーコンピュータを用いてこの問題点を解決した。

Report

(1 results)
  • 2001 Annual Research Report
  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] Sadakane, K., Shibuya, T.: "Indexing Huge Genome Sequences for Solving Various Problems"Genome Informatics 2001', Universal Academy Press. 175-183 (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] Sadakane, K.: "Succinct Representations of lcp Information and Improvements in the Compressed Suffix Arrays"Proceedings of ACM-SIAM Symposium on Discrete Algorithms. 225-232 (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] Sadakane, K., Imai, H.: "Fast Algorithms for k-Word Proximity Search"IEICE Trans. Fundamentals.. E-84A, 9. 2311-2318 (2002)

    • Related Report
      2001 Annual Research Report

URL: 

Published: 2001-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi