2003 Fiscal Year Annual Research Report
相互情報量に基づいた遺伝子配列アライメントの高速化手法に関する研究
Project/Area Number |
15700245
|
Research Institution | Osaka University |
Principal Investigator |
竹中 要一 大阪大学, 情報科学研究科, 助教授 (00324830)
|
Keywords | バイオインフォマティクス / 遺伝子 / DNA / アライメント / 相互情報量 |
Research Abstract |
本研究では,組合せ最適化問題の近似的解法に関する研究経験をもとに,一生物の遺伝子配列対データベースの全遺伝子配列のホモロジー探索を高速化する手法に関する研究を行っている.それを目標として、本年度は二遺伝子間の相互情報量を計算する方法に関する研究を行った。具体的には、1.アライメントを行う遺伝子数の絞込みに対する相互情報量の利用可能性の評価、2.提案アルゴリズムとアライメントアルゴリズムとの統合時における性能評価に関する研究を遂行した。これらのために、二遺伝子間の相互情報量を計算する方法の検討を行い、次いでアルゴリズムの考案を行った。このアルゴリズムに対して、GenBankの各種遺伝子の塩基配列に対して1対1対応の計算を行った。また最もよく使われるアルゴリズムであるBLASTの結果と対比させることにより、絞込みを行うための評価方法に対する検討を行うことで、本研究計画における基礎データの収集を行った。また、計算時間を削減する方法として、符号理論の分野において完全線形符号と呼ばれる符合を応用する方法を考案した。ここでは、線形符号の符号化、復号化のプロセスを用いることにより緩やか且つ非可逆な符号圧縮をかける。圧縮した結果を解凍しても完全には元にもどらないが、利用するに十分の精度があるのが非可逆な圧縮の特徴であり、「緩やかな」の意図は圧縮した状態でも、計算において圧縮前と同様の扱いができるということである。他分野の例としては画像において色数削減による圧縮を行う方式が挙げられる。本提案手法を用いることによりデータ量を大幅削減可能となるため、その結果として計算時間を大幅に短縮することが可能になると考えている。アライメントのさら高速化に役することを、国際会議ISMB2003において行った。
|
Research Products
(6 results)
-
[Publications] Hideya Kawaji: "Graph-based clustering for finding distant relationships in a large set of protein sequences"Bioinformatics. Vol.20,No.2. 243-252 (2004)
-
[Publications] Shoko Miyake: "A clustering method for comparative analysis between Genomes and Pathways"8th International Conference on Database Systems for Advanced Applications. DASFAA2003. 327-334 (2003)
-
[Publications] Yoichi Takenaka: "Frequency enumeration of DNA subsequences from large-scale sequences using linear code"11th International Conference on Intelligent Systems for Molecular Biology. ISMB2003. I-19 (2003)
-
[Publications] Shigeto Seno: "P-Quasi Complete Linkage Clustering Method for Gene-Expression Profiles based on Distribution Analysis"1th International Conference on Intelligent Systems for Molecular Biology. ISMB2003. B-59 (2003)
-
[Publications] Shoko Miyake: "A network analysis method by comparing microbial metabolic pathways"Escherichia coli Conference Towards New Biology in the 21st Century. (2003)
-
[Publications] Vorathaya Tantoolvesm: "Mapping of Artificial Nucleosome Positioning Sequences to the Saccharomyces cerevisiae Genome"Genome Informatics. No.14. 462-463 (2003)