研究課題
今日、爆発的に増加するビッグデータに対応した検索技術がもとめられている。これに対し、近年、データベースの統計的挙動を活用するSMADとよぶアルゴリズム設計の研究が行われ、理論・実用両面の大幅な検索高速化が図られ脚光を浴びている。一方今日の多様化するビッグデータ状況では、データベース側のみならず検索クエリー側も計測技術などの著しい発展にともない大規模・多様化している。本研究は、ビッグクエリー時代のビッグデータ検索に対応するため、巨大データゆえに見えてくる大規模データベースと巨大クエリーそれぞれの統計的挙動を相乗的に活用し、現実時間での超高速検索を実現するための技術を開発・応用し、新しい超高速ビッグクエリー×ビッグデータ検索アルゴリズムの基盤を確立することを目的として研究を展開してきた。この目的に対して、本年度は、これまで開発することに成功したタンパク質立体構造高速検索、ゲノムグラフによる大規模個人ゲノムデータベース検索基盤実装、プライバシー保護技術などをさらに統合し、より硬度なプライバシー保護検索技術の確立を狙うとともに、様々なグラフ表現されるデータベースを中心にSMAD技術によるプライバシー保護技術開発のさらなる開発展開を行い、ware leveling とよばれるデータ保護の新たな手法開発に成功した。また、大規模クエリーデータとして用いられる自然言語に関しても転移学習の観点から新技術の開拓に成功した。
令和2年度が最終年度であるため、記入しない。
すべて 2021 2020
すべて 雑誌論文 (3件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 2件) 学会発表 (2件) (うち国際学会 1件、 招待講演 2件)
Proc. ICMLA 2020
巻: 1 ページ: 994-1001
10.1109/ICMLA51294.2020.00161
Proc. CLEF 2020, CEUR Workshop Proceedings
巻: 2696(66) ページ: 1-15
Leibniz International Proceedings in Informatics (LIPIcs)
巻: 181(65) ページ: 1-17
10.4230/LIPIcs.ISAAC.2020.65