2011 Fiscal Year Annual Research Report
大量シークエンシング時代に向けた新規配列比較法の開発
Project/Area Number |
22310124
|
Research Institution | Kyoto University |
Principal Investigator |
後藤 修 京都大学, 情報学研究科, 教授 (40142111)
|
Co-Investigator(Kenkyū-buntansha) |
市瀬 夏洋 京都大学, 情報学研究科, 助教 (70302750)
|
Keywords | ゲノム / 配列比較 / アラインメント / 遺伝子発見 / 次世代シークエンサー / 比較ゲノム / アルゴリズム / スプライシング |
Research Abstract |
本研究課題の第一の目的は、大量の転写産物配列を既知のゲノム配列に対してマップし、イントロン介在の可能性を考慮しながら正確なアラインメントを行うソフトウェアツールの開発である。平成22年度は主に後段のアラインメント段階について精度の向上を図った。具体的には、各生物種に特異的なゲノム配列の特徴量を考慮できるよう、申請者が独自に開発したマッピング・アラインメントツールである「Spaln」を改良した。これを踏まえ、平成23年度には主に次の3つの課題に取り組んだ。第一に、スプライスアラインメントの性能を検定するための大規模データベースを作成し、旧版のSpalnを含む様々な既存法と改良版Spalnとの性能を比較した。様々な条件下で行った検定の結果、ほとんどの場合改良版Spalnが最高の精度を示すことが確かめられた。第二に、アルゴリズムの最初の段階であるマッピングの性能向上を図った。問い合わせ配列がEST程度に長い場合にはマッピング段階においてもSpalnは元々優れた性能を示していたが、短い問い合わせ配列では検出感度が低下するという弱点があった。この弱点を克服するために、異なるビットパターンを持つ複数の不連続シードを組み合わせることによる検出感度の向上を試みた。第三に、Gray Codeを利用した高速、高感度のモチーフ抽出アルゴリズムを開発した。検出感度を同等かそれ以上に保ちながら、従来法に比ベ2~3桁高速に転写制御因子結合部位などのモチーフを抽出できることが確かめられた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題で開発するツールはゲノムマッピングとスプライスアラインメントという大きく二つの段階から構成される。初年度にアラインメント段階の改良を行い、昨年度実施した大規模検定の結果その有効性が確認できた。昨年度はマッピング段階の改良を実施し、その成果の確認を現在行っている。このように、ほぼ計画に沿った進展が実現できている。
|
Strategy for Future Research Activity |
本年度は本研究計画の最終実施年度であるため、これまで開発してきた手法の完成に向けた更なるSpalnプログラムの改良に取り組む。モチーフ抽出に関してその有用性が確認されたGray Codeの利用およびBWT手法との融合法についても引き続き検討を行う。また、多数の利用者の便を図るため、ホームページのGUIをより充実させ、インターネットを通したサービスの利便性を高める。
|