研究課題/領域番号 |
17H01693
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報学基礎理論
|
研究機関 | 東京大学 |
研究代表者 |
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
11,570千円 (直接経費: 8,900千円、間接経費: 2,670千円)
2020年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2019年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2018年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2017年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | アルゴリズム理論 / アルゴリズム / バイオインフォマティクス / ビッグデータ / 次世代シークエンサー / 差分プライバシー / 秘匿検索 / 検索技術 / ビッグクエリー / SMAD / SMAD |
研究成果の概要 |
爆発的に増加するビッグデータに対応した検索技術が求められている。これに対し、データベースの統計的挙動を活用するSMAD (Statistical Model-based Algorithm Design)技術が注目されている。本研究ではこのSMAD技術をビッグクエリー×ビッグデータ検索へ展開させる研究を行った。特に、個人ゲノムデータベース、タンパク質立体構造データベース、自然言語テキストデータベースなど様々なデータベースに対する大規模検索の基盤技術を開発することに成功したほか、プライバシー保護技術、PCMメモリにおけるメモリ分散技術、次世代シークエンサー解析などの技術開発にも成功した。
|
研究成果の学術的意義や社会的意義 |
近年のデータ爆発は、大規模ビッグデータに対する大規模なクエリーを著しく困難にしており、それに対する超効率な検索基盤技術の開発が求められている。本研究では、SMAD技術を核に、ゲノムデータベース、タンパク質立体構造データベース、自然言語テキストデータベースなど様々なデータベースに対する検索技術の開発に成功したほか、プライバシー保護、PCMメモリの活用、次世代シークエンサー解析など、様々なデータ解析の基盤技術の高度化にも貢献することに成功している。これらの技術によって、今後さらにビッグデータの利活用が高度化されることが期待できる。
|