• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

ビッグクエリー×ビッグデータ検索実現のためのSMAD技術の新展開

研究課題

研究課題/領域番号 17H01693
研究機関東京大学

研究代表者

渋谷 哲朗  東京大学, 医科学研究所, 教授 (60396893)

研究期間 (年度) 2017-04-01 – 2021-03-31
キーワードアルゴリズム / バイオインフォマティクス / ビッグデータ / 次世代シークエンサー / 差分プライバシー
研究実績の概要

様々な分野の多くのデータベースにおいて、データベース側のみならず検索側のデータも複雑化・大型化しており、必要とされる高速・高精度な検索を実現するアルゴリズム設計はますます困難となっている。一方、大規模化するデータベースに対する検索アルゴリズムについては、これまでも様々なアプローチから研究がなされ、特にSMADとよばれるデータベースの統計的挙動を活用するアルゴリズム設計による高速化が脚光をあびている。本研究ではこれまで、このSMADとよばれるデータベース検索のためのアルゴリズム設計パラダイムを、検索側のデータが巨大な場合にも広げるためのアルゴリズム基盤の構築をめざして研究を行い、これまでもタンパク質立体構造類似検索の成果などを上げてきた。本年度は、さらに新たな研究対象として次世代シークエンサーにおける巨大検索データに関する研究を行った。次世代シークエンサーにおいては、次世代シークエンサーより出力された出力を、ヒト参照ゲノムをはじめとする様々なデータベースに対して検索を行うが、その検索を正確かつ高度なものとするためには、データの高精度化および検索可能なデータ抽出が必要になる。本研究では、そのためのセグメンテーション技術の研究を行った。また、グラフ上の検索手法に関する調査研究を行うとともに、より複雑なプライバシー保護検索応用として、差分プライバシーを考えた高度検索を行う技術の開発を開始した。また、本年度はこれらの技術をベースとして、自然言語処理に関する新たな技術開発研究も開始した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度と2年目にかけて、タンパク質立体構造データベース検索問題について検討・調査を行い、新たな検索技法に関する成果を上げることができた。また、同時に複雑なグラフ索引手法に関する議論・検討も行い、成果を上げることができた。

さらに3年目には大規模個人ゲノムデータベース検索において重要な検索側データの整備に関する新たな成果をあげることができた。

それと同時に、プライバシー保護を考慮したデータベース検索に関しても確実に成果を上げつつある。また、これまでに得た知見に関しては、サーベイ論文などにまとめるなど一般への知識波及に関しても進めることができた。

今後の研究の推進方策

最終年度となる本年度は、これらの研究をさらに推し進め、プライバシー保護技術分野での実際の検索技法の確立、またゲノムデータベースやタンパク質立体構造データベースのさらに新たな検索技法の確立を狙っていく。さらに今後はこれらの検索技術を自然言語処理にも応用する展開も行っていく。その上で、本研究終了後のさらなる展開につなげていくことをめざす。

  • 研究成果

    (4件)

すべて 2020 2019

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 1件) 学会発表 (1件) (うち国際学会 1件)

  • [雑誌論文] Nanopore basecalling from a perspective of instance segmentation2020

    • 著者名/発表者名
      Yao-zhong Zhang, Arda Akdemir, Georg Tremmel, Seiya Imoto, Satoru Miyano, Tetsuo Shibuya, and Rui Yamaguchi
    • 雑誌名

      BMC Bioinformatics

      巻: 21 ページ: 1-9

    • DOI

      https://doi.org/10.1186/s12859-020-3459-0

    • 査読あり / オープンアクセス
  • [雑誌論文] Application-Oriented Succinct Data Structures for Big Data, The Review of Socionetwork Strategies2019

    • 著者名/発表者名
      Tetsuo Shibuya
    • 雑誌名

      The Review of Socionetwork Strategies

      巻: 13 ページ: 227-236

    • DOI

      https://doi.org/10.1007/s12626-019-00045-1

    • 査読あり
  • [雑誌論文] Efficient Approximate 3-Dimensional Point Set Matching Using Root-Mean-Square Deviation Score2019

    • 著者名/発表者名
      Yoichi Sasaki, Tetsuo Shibuya, Kimihito Ito, and Hiroki Arimura
    • 雑誌名

      IEICE Transactions on Fundamentals

      巻: E102.A(9) ページ: 1159-1170

    • DOI

      https://doi.org/10.1587/transfun.E102.A.986

    • 査読あり
  • [学会発表] Nanopore base-calling from a perspective of instance segmentation2019

    • 著者名/発表者名
      Yao-zhong Zhang, Arda Akdemir, Georg Tremmel, Seiya Imoto, Satoru Miyano, Tetsuo Shibuya, Rui Yamaguchi
    • 学会等名
      ISMB-ECCB 2019
    • 国際学会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi