Development of SMAD for big query on big data
Project/Area Number |
17H01693
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Research Field |
Theory of informatics
|
Research Institution | The University of Tokyo |
Principal Investigator |
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Project Status |
Completed (Fiscal Year 2020)
|
Budget Amount *help |
¥11,570,000 (Direct Cost: ¥8,900,000、Indirect Cost: ¥2,670,000)
Fiscal Year 2020: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2019: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2018: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Fiscal Year 2017: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
|
Keywords | アルゴリズム理論 / アルゴリズム / バイオインフォマティクス / ビッグデータ / 次世代シークエンサー / 差分プライバシー / 秘匿検索 / 検索技術 / ビッグクエリー / SMAD / SMAD |
Outline of Final Research Achievements |
A new technology for searching big data is desired. SMAD (Statistical Model-based Algorithm Design) is a candidate for improving these searching algorithms. In this research, we explored applications of SMAD technology to big query/big data searching problems. In particular, we developed new searching technologies for individual genome databases, protein 3-D databases, and natural language text databases. Moreover we succeeded in developing technologies for privacy preserving, memory distribution for PCM memories, and next generation sequencer read analysis.
|
Academic Significance and Societal Importance of the Research Achievements |
近年のデータ爆発は、大規模ビッグデータに対する大規模なクエリーを著しく困難にしており、それに対する超効率な検索基盤技術の開発が求められている。本研究では、SMAD技術を核に、ゲノムデータベース、タンパク質立体構造データベース、自然言語テキストデータベースなど様々なデータベースに対する検索技術の開発に成功したほか、プライバシー保護、PCMメモリの活用、次世代シークエンサー解析など、様々なデータ解析の基盤技術の高度化にも貢献することに成功している。これらの技術によって、今後さらにビッグデータの利活用が高度化されることが期待できる。
|
Report
(5 results)
Research Products
(13 results)