一般化文字列探索のための知的アルゴリズムと並列処理による高速化
Project/Area Number |
03266202
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
今井 浩 東京大学, 理学部, 助教授 (80183010)
|
Co-Investigator(Kenkyū-buntansha) |
久保田 光一 慶応義塾大学, 理学部, 助手 (90178046)
HOULE Michea 東京大学, 理学部, 助手 (80221000)
|
Project Period (FY) |
1991
|
Project Status |
Completed (Fiscal Year 1991)
|
Budget Amount *help |
¥3,000,000 (Direct Cost: ¥3,000,000)
Fiscal Year 1991: ¥3,000,000 (Direct Cost: ¥3,000,000)
|
Keywords | 遺伝子情報処理 / 最長共通部分列問題 / アライメント / 最短共通部分列問題 |
Research Abstract |
ゲノム解析に伴う大量知識情報処理では、DNAとタンパク質の配列デ-タなどの大量情報を知的に高速処理することが必要である。配列デ-タを文字列として処理して、その中に含まれる生物学的意味を求めるためには、文字列処理のための高速アルゴリズムが必要になる。本年度の研究では、この文字列処理の問題の代表的な問題である最短共通超文字列問題と最長共通部分列問題について研究を行なった。 最短共通超文字列問題は、多くの文字列が与えられた時、それらを部分列として含む文字列(超文字列)の内、最短のものを求める問題である。この問題は、DNAからその塩基配列を実際に読みとる時、非常に長い列の一部分をサンプリングして読みとり、それらをつなげて元の塩基配列を求めることに対応する。一般にこの問題がNP困難な難しい問題であることがわかっているが、本年度の研究では、生下学的な条件の一部を加味したときに問題がどれぐらい易しくなるかという点について検討した。これまでのところ、最後に構成される超文字列の長さがわかっているという程度では、あまり易しくならないという結果を得ている。 最長共通部分列問題は、k本の文字列が与えられた時、それぞれの文字列の共通な部分列で長さが最も長いものを求める問題である。この問題は、ある種の共通な性質を有するいくつかのDNAの配列から、その共通な性質を特定するための部分列を求める問題に対応する。既存の研究では、k=2の場合について効率的なアルゴリズムが与えられているが、k【greater than or equal】3については、まだまだ計算時間のかかるアルゴリズムしか知られていない。本年度の研究では、塩基配列の文字数が4種と少ないことに着目し、これを利用してk【greater than or equal】3の場合もより効率良く解くアルゴリズムの設計を行なった。次年度において、このアルゴルズムを実装
|
Report
(1 results)
Research Products
(2 results)