公募研究
従来の統計・情報学的手法では解析困難な生命科学ビッグデータが蓄積しつつある。近年、真核生物ではタンパク質をコードしない非コードDNAが大半を占め、ヒトゲノムの98%が非コード領域であることが明らかとなり、このような非コード領域には、多くの機能性非コード領域が未発見のまま残されている。進化保存性をもつ非コード因子は、非コード型転写・翻訳制御因子として有力であるが、当該領域においてほとんど研究されてない。そこで、本提案では、「非コード型転写・翻訳制御因子をゲノム網羅探索するための情報工学的な基盤技術開発」を行うことで当該領域を支援する。本研究は植物で可能だった解析(の拡張法)をヒトをはじめとした様々な生物に適用するための方法論の開発、それを利用した多型、病態との関連性の解析であり、大きく(1)機能性非コード領域同定の方法論の開発、(2)規則性抽出、(3)非コード領域と疾患との関連解析からなる。平成26年度は、方法論の開発を行い、方法論の骨格ができあがった。この方法論では、ヒトゲノムにも応用可能なことが分かり、新しい分子の候補もあがってきているが、このような方法論を確立するには、データベースのデータのクレンジング手法の開発が重要なことが判明し、データクレンジング機能を新手法に追加した。さらに、植物界で、保存された非コード領域上ペプチド配列を、実験的に破壊し、機能を有することを証明した。今回の解析結果から、eIF遺伝子の上流に動物界・植物界に共通して、保存されたuORFペプチドが存在することを同定し、これらは、動物界・植物界で全く違うものであることが判明した。つまり、eIF遺伝子の上流のペプチド配列は、動物界・植物界で、別々に平行進化してきたものであると考えられる。
2: おおむね順調に進展している
平成26昨年度は、「(1)機能性非コード領域同定の方法論の開発」を行う計画であり、uORF型の機能性領域の同定と、動植物界への応用に成功している。生命科学ビッグデータにデータクレンジング技術が、必要なことはある程度想定の範囲内であったが、予想以上に多くの技術開発を必要とした。しかし、一方で、ヒトゲノムの非コード領域上に座乗する多型と抗がん剤の副作用や奏効性予測が関係することを明らかにしていることから、平成26昨年度の達成度としては、おおむね順調に進んでいると判断した。
平成27昨年度は、(2)規則性抽出、(3)非コード領域と疾患との関連解析を実施する予定である。(1)についても、進行中であるが、おおよそ重要な技術的な問題についてはクリアできており、平成26昨年度に購入した計算サーバーで、プログラム微調整を行いつつ、引き続き、ビッグデータの解析を行う予定である。(3)非コード領域と疾患との関連解析については、平成26昨年度に、ある程度、実施したが、連携研究者との協力の下で、引き続き、遂行する予定である。
すべて 2015 2014
すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件、 謝辞記載あり 2件) 学会発表 (6件)
Nucleic Acids Res.
巻: 43 ページ: 1562-1576
10.1093/nar/gkv018
PLoS ONE
巻: 9 ページ: e105160
10.1371/journal.pone.0105160
巻: 9 ページ: e106801
10.1371/journal.pone.0106801