• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

ヒト全ゲノムシークエンスのための統合アノテーションワークフローの構築

研究課題

研究課題/領域番号 25430183
研究種目

基盤研究(C)

研究機関長崎大学

研究代表者

三嶋 博之  長崎大学, 原爆後障害医療研究所, 助教 (10513319)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワードゲノム / データベース生物学 / バイオインフォマティクス / Ruby / REST API / 次世代シークエンサー / TogoWS / UCSCゲノムデータベース
研究概要

本年度の目標である、「UCSCゲノムデータベースにおいて、各種テーブルがMySQLに収載されているか、あるいはBigWig形式の連続データとして別ファイルで提供されているかをユーザーが意識せず一貫したAPIでアクセス可能にする」の実現のため、TogoWS http://togows.org/ に対するBioRubyプラグインRuby UCSC APIの組み込みを行った。
連携研究者とともにREST APIの設計を行い、Ruby UCSC APIが対応する全てのテーブルについて複数条件(例えばゲノム上物理位置範囲)を組み合わせた検索と、タブ区切り文字列あるいはJSON形式での結果取得が可能になった。BigWig形式のファイルについては初回参照時に内部でキャッシュされ、bigWigInfoコマンド、bigWigSummaryコマンドの結果を取得することが可能になった。特筆すべき機能は、サポートされた生物のリファレンス配列の任意部分を単純かつ高速に取得できることである。この機能は広くユーザーの利便性を高めると思われる
UCSCゲノムデータベースのヒトリファレンスは現在hg19からhg38の移行が行われている。Ruby UCSC APIは、すでにhg38の対応を行い https://github.com/misshie/bioruby-ucsc-api および http://rubygems.org/gems/bio-ucsc-api にて公開している。基本的に新規のテーブル追加には自動的に対応されるが、今後も例外的なテーブルについては順次対応を進めるとともに、ユーザーからのフィードバックを受けながら機能拡充を続ける予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初計画していたTogoWSのUCSCゲノムデータベース対応は、ほぼ達成することができた。今後ドキュメントの整備をすすめる必要がある。Ruby UCSC APIの機能拡張については、BigWigファイルのキャッシュ対応はまだできていない。これについては、多くのBigWigファイルの少数の部分を参照する場合、ローカル環境よりむしろTogoWSの使用によって達成できたと考えられる。また、Ruby UCSC APIの新規データベース対応をすすめることで同時にTogoWSの機能拡張につなげることができるようになっている。

今後の研究の推進方策

ヒト全ゲノムシークエンシングの統合アノテーションワークフローの構築にむけて最も難しい点は、膨大なデータベースの中から、必要なアノテーションデータの組み合わせを見つけることである。これを解決するための今後の方策として、セマンティックウェブ技術をUCSCゲノムデータベースやそれに含まれるENCODEデータに対して応用することを予定している。UCSCゲノムデータベース/ENCODEデータのRDF化をすすめることで、最終的なワークフローの構築を目指す。

次年度の研究費の使用計画

本年度においては、TogoWSやRuby UCSC APIなど基盤となるデータベース利用環境の整備が中心となり、実際の確認/実証実験に入ることは無かったため、次年度使用額が生じた。
前年度をふまえたデータベース環境構築のための打ち合わせ・発表、計算機環境整備、およびワークフローの実証実験に用いる予定である。

  • 研究成果

    (10件)

すべて 2014 2013 その他

すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (3件) 備考 (3件)

  • [雑誌論文] Single human papillomavirus 16 or 52 infection and later cytological findings in Japanese women with NILM or ASC-US2014

    • 著者名/発表者名
      Abe S, Miura K, Kinoshita A, Mishima H, Miura S, Yamasaki K, Hasegawa Y, Higashijima A, Jo O, Yoshida A, Kaneuchi M, Yoshiura K, Masuzaki H
    • 雑誌名

      Journal of Human Genetics

      巻: - ページ: -

    • DOI

      10.1038/jhg.2014.9

    • 査読あり
  • [雑誌論文] Identification of endometrioid endometrial carcinoma-associated microRNAs in tissue and plasma. Gynecologic Oncology2014

    • 著者名/発表者名
      Tsukamoto O, Miura K, Mishima H, Abe S, Kaneuchi M, Higashijima A, Miura S, Kinoshita A, Yoshiura K, Masuzaki H
    • 雑誌名

      Gynecologic Oncology

      巻: 132 ページ: 715-721

    • DOI

      10.1016/j.ygyno.2014.01.029

    • 査読あり
  • [雑誌論文] Predominantly placenta-expressed mRNAs in maternal plasma as predictive markers for twin–twin transfusion syndrome2014

    • 著者名/発表者名
      Miura K, Higashijima A, Miura S, Mishima H, Yamasaki K, Abe S, Hasegawa Y, Kaneuchi M, Yoshida A, Kinoshita A, Yoshiura K, Masuzaki H
    • 雑誌名

      Prenatal Diagnosis

      巻: 34 ページ: 345-349

    • DOI

      10.1002/pd.4307

    • 査読あり
  • [雑誌論文] 全エクソーム解析における情報処理2013

    • 著者名/発表者名
      三嶋博之
    • 雑誌名

      医学のあゆみ

      巻: 245 ページ: 345-351

  • [学会発表] (2-47-B) TogoWS RESTサービスによるUCSCゲノムデータベースの利用2013

    • 著者名/発表者名
      三嶋博之,西澤達也,片山俊明
    • 学会等名
      NGS現場の会第三回研究会
    • 発表場所
      神戸市神戸国際会議場
    • 年月日
      20130904-20130905
  • [学会発表] (O44)TogoWS REST サービスによるUCSCゲノムデータベースの利用

    • 著者名/発表者名
      三嶋博之,西澤達也,吉浦孝一郎,片山俊明
    • 学会等名
      日本人類遺伝学会第58回大会
    • 発表場所
      仙台市江陽グランドホテル
  • [学会発表] Gene Hunting: できること・できないこと

    • 著者名/発表者名
      三嶋博之
    • 学会等名
      生命医薬情報学連合大会
    • 発表場所
      東京都江戸川区タワーホール深堀
  • [備考] TogoWS

    • URL

      http://togows.org/

  • [備考] GitHub - Ruby UCSC API

    • URL

      https://github.com/misshie/bioruby-ucsc-api

  • [備考] RubyGems - bio-ucsc-api

    • URL

      http://rubygems.org/gems/bio-ucsc-api

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi