1991 Fiscal Year Annual Research Report
Project/Area Number |
03266212
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
篠原 武 九州工業大学, 情報工学部, 助教授 (60154225)
|
Co-Investigator(Kenkyū-buntansha) |
溝口 佳寛 九州工業大学, 情報工学部, 講師 (80209783)
|
Keywords | 文字列パタ-ン照合 / DNA / 塩基配列デ-タベ-ス / ゲノム解析 / デ-タ圧縮 / 情報検索 / Huffman符号 / 高速化 |
Research Abstract |
文字列パタ-ン照合とは,文字列パタ-ンのテキスト中における出現位置を検出することであり,これまでにも情報検索システムやデ-タベ-スシステムにおいて最も基本的かつ重要な機構として活用されてきている.遺伝情報の本体であるDNAは,基本的には,‘A',‘T','C',‘G'の4種類の記号からなる文字列である. 本研究の目的は,パタ-ン照合の処理対象がDNAの塩基配列である場合を取り上げて,その高速なアルゴリズムの実現方法について研究を進めていくとともに,実際にゲノム研究者のツ-ルとして有用なシステムの構築を行うことである. 本年度は,次の2点を中心に研究を進めた。 1.塩基配列用パタ-ン照合アルゴリズムの高速化 さまざまな観点から塩基配列用のパタ-ン照合アルゴリズムについて考察し,その高速化の可能性を探る.とくに,情報圧縮を利用する高速化や並列化による高速化について塩基配列への適用可能性を検討する。DNA塩基配列デ-タを構成する文字種は非常に少なく,しかもそのほとんどが,‘A',‘T',‘C',‘G'であるが,通常のシステムでは,これをそのまま計算機の文字(8ビット)で表現している.このデ-タをHuffman符号によって圧縮し,それをそのまま復号することなく走査するアルゴリズムを考案した.これにより,デ-タを効率的に圧縮し,しかも検索を高速に実行することが可能であることがわかった. 2.テキストデ-タベ-ス管理システムSIGMAの整備 SIGMAは,著者らが開発し,九州大学大型計算機センタ-で一般に公開している汎用のテキストデ-タベ-ス管理システムであり,高速な文字列パタ-ン照合アルゴリズムを駆使した効果的な情報システムである。このSIGMAシステムをゲノム研究者のツ-ルとして活用できるように整備していく。DNA塩基配列デ-タベ-スGanBankをSIGMAのファイルに変換し,管理・検索できることを確認した。これを,全国の研究者が共同利用できるデ-タベ-スとして公開すれば,ゲノム研究者によるさまざまな検索が可能になる.
|
Research Products
(6 results)
-
[Publications] 有川 節夫,久原 哲,宮野 悟,篠原 歩,篠原 武: "EFSの学習可能性と膜蛋白領域予測への応用" 情報処理学会情報学基礎研究会資料. 23ー1. 1-8 (1991)
-
[Publications] 深町 修一,篠原 武: "圧縮デ-タのための高速文字列パタ-ン照合技法" 情報処理学会全国大会(第43回)論文集. vol.4. 83-84 (1991)
-
[Publications] 篠原 武,有川 節夫,久原 哲,宮原 哲浩,井上 仁,篠原 歩,内田 智之: "テキストデ-タベ-ス管理システムSIGMAとゲノム解析への応用" 第2回公開ワ-クショップ「ヒトゲノム計画と情報解析技術」. 29-32 (1991)
-
[Publications] 有川 節夫,久原 哲,宮野 悟 篠原 歩,篠原 武: "ネガティブモチ-フの機械発見" 第2回公開ワ-クショップ「ヒトゲノム計画と情報解析技術」. 62-65 (1991)
-
[Publications] Arikawa,S.,Miyano,S.,Kuhara,S.,Shinohara,A.,Shinohara,T.: "A learning algorithm for elementary formal systems and its experiments on identication of transmembrane domains" Proceedings of the 25th Hawaii International Conference on System Sciences. vol.I. 675-684 (1992)
-
[Publications] 深町 修一,篠原 武,竹田 正幸: "可変長符号圧縮デ-タのための文字列パタ-ン照合ーゲノム情報の高速検索技法ー" 「1992年情報学」シンポジウム. 95-103 (1992)