2014 Fiscal Year Research-status Report
類似ゲノムの差異を逃さないDe novoゲノム解析技術の開発
Project/Area Number |
26540159
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
清水 佳奈 独立行政法人産業技術総合研究所, ゲノム情報研究センター, 主任研究員 (60367050)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 次世代シークエンスデータ / Alignment free / Structural variation |
Outline of Annual Research Achievements |
高速シークエンサーの普及により,個人レベル,さらには細胞レベルでゲノム情報を取得することが可能となった.近年の研究により,同一個体であったとしても臓器・器官・時系列における所在の違いにより,ゲノム配列は非常に多様であることが示唆された.そのため,共通点を多く含みながらも確実に異なるゲノムの“個性”を正確に捉える技術の開発が強く望まれている.ところが,現在主流となっている情報解析の手法では,シークエンサーから出力された断片配列をまずはじめに参照ゲノムに対して貼り付けて,その結果から統計情報を得る方策がとられているため,得られる解析結果は参照ゲノムの特徴に大きく左右されてしまい,ゲノムの多様性を見落としてしまう危険性がある. そこで本研究では,シークエンサーから得られたデータのみからできる限りの情報を抽出し,必要に応じて既知ゲノムを利用するという新しい解析の方向性を模索し,ゲノムの多様性を見落とさない解析技術を開発することをめざす. 今年度は,異なるゲノム由来の次世代シークエンスデータを,参照ゲノムを用いずに直接的に比較して,差異のある箇所を抽出するアルゴリズムの開発に注力した.具体的には次の項目を実施した. (1) 二つの次世代シークエンスデータセットを比較し,差異のあるゲノム配列を特定するアルゴリズムの設計を行った. (2) (1)で設計したアルゴリズムのプロトタイプ実装を行った.(3) 並列化技術などを用いて大量のデータに対しても現実的な時間で動作するように工夫を加えた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通り,初年度は基礎的なアルゴリズムの設計とプロトタイプの実装を達成することができたため.
|
Strategy for Future Research Activity |
今後は,今年度開発したアルゴリズムの改良と,実データを用いた解析への応用を推進していく.今年度は,二つのデータセット間で出現頻度に大きな差異のある可変長の部分文字列(以下differential k-mer)を発見した後,differential k-merを含むリードのみを抜き出すソフトウェアの開発を達成したが,差異を判定する統計モデルは簡便なものを用いた.次年度以降は,解析対象とするデータセットの特徴をさらに検討して,目的に応じた統計モデルを導入することが課題となる.現段階ではデータのばらつきの影響を考慮することが可能なNegative Binomialを用いた統計モデルを用いることを検討している. また,実データを用いた解析に関しては,共同研究先のデータ(ガンゲノム)の解析を行い,ガンの原因箇所の候補を洗い出すことを検討している.
|
Causes of Carryover |
本研究費を活用して年度を跨ぐ海外出張を行った。本研究費は基金であるため、本来であれば年度の切れ目を意識することなく支出が可能であったはずなのだが、別予算(所属研究機関の交付金)とあわせて支出を行ったため、3月末分と4月以降にかかった経費を別々に計上する必要があったため。
|
Expenditure Plan for Carryover Budget |
主として、上記に述べた一連の出張に必要となった金額のうち、2015年4月分の旅費に充てる。また、残りは研究に必要なハードディスクの購入などに充てる。
|
Research Products
(1 results)