相互情報量に基づいた遺伝子配列アライメントの高速化手法に関する研究
Project/Area Number |
15700245
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Bioinformatics/Life informatics
|
Research Institution | Osaka University |
Principal Investigator |
竹中 要一 大阪大学, 大学院・情報科学研究科, 助教授 (00324830)
|
Project Period (FY) |
2003 – 2005
|
Project Status |
Completed (Fiscal Year 2005)
|
Budget Amount *help |
¥3,100,000 (Direct Cost: ¥3,100,000)
Fiscal Year 2005: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2004: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2003: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | バイオインフォマティクス / 遺伝子 / DNA / アライメント / 相互情報量 / バイオインフォマティク |
Research Abstract |
本研究では,組合せ最適化問題の近似的解法に関する研究経験をもとに,遺伝子配列アラインメントに関する研究を行った.第一に,二遺伝子間の相互情報量を計算する方法に関する研究を行った。具体的には、アライメントを行う遺伝子数の絞込みに対する完全線形符号化後の相互情報量の利用可能性の評価を行った。符号理論は計算機の分野で用いられてきたため、符号のアルファベットとして基本的に2文字(0,1)が扱われてきた。これをDNAの4文字(ATGC),またはアミノ酸の20文字を扱えるように工夫した。この際、単に2値(0,1)の拡張(DNAの場合2桁、アミノ酸の場合5桁)で表現するのではなく、符号の元数をDNAやアミノ酸の文字数に合わせる。このことにより、2値の拡張符号として表現した時と異なり、各DNAやアミノ酸を計算機での表現上において対等に、または等価なものとして扱うことが可能になる。本符号を用いることにより、緩やか且つ非可逆な符号圧縮をかける。具体的には,4元ガロア体,または19元体上での完全線形符号の復号化処理を,圧縮として応用する.圧縮した符号を複号しても完全には元の配列にもどらないが、利用するに十分の精度があるのが非可逆な圧縮の特徴であり、「緩やかな」の意図は圧縮した状態でも、計算において圧縮前と同様の扱いができるということである。これによりデータ量の圧縮を、ひいては計算時間の短縮が可能であると考えた.第二にこの符号化法用いた多重配列アライメントに関する研究を行った.遺伝子配列間の類似度が高い場合,及び低い場合に提案法が比較的良好な性質を有することが明らかになるとともに,符号化法について諸々の性質に関する知見を得る事ができた.
|
Report
(3 results)
Research Products
(14 results)