2023 Fiscal Year Annual Research Report
Big Data Processing with Compressed Secure Computation
Project/Area Number |
21H05052
|
Research Institution | The University of Tokyo |
Principal Investigator |
定兼 邦彦 東京大学, 大学院情報理工学系研究科, 教授 (20323090)
|
Co-Investigator(Kenkyū-buntansha) |
坂本 比呂志 九州工業大学, 大学院情報工学研究院, 教授 (50315123)
清水 佳奈 早稲田大学, 理工学術院, 教授 (60367050)
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
申 吉浩 学習院大学, 付置研究所, 教授 (60523587)
神保 洸貴 東京理科大学, 創域理工学部情報計算科学科, 助教 (80966630)
|
Project Period (FY) |
2021-07-05 – 2026-03-31
|
Keywords | 秘匿計算 |
Outline of Annual Research Achievements |
秘密分散に基づく秘匿計算として,配列へのランダムアクセスを可能にするORAM,データ圧縮に用いる可変長符号の符号化・復号化,グループに分割されたデータのソート,AESを用いた暗号化についてそれぞれ効率的なプロトコルを開発した. Function Secret Sharing という手法を用い,秘密分散法を用いて格納された文字列からの全文検索と,決定木評価のためのプロトコルを開発した. 連合学習は,複数のパーティが自身の保有するデータを公開することなく,統合されたデータの学習を可能とすることを目的する技術である.データのカーネル値への変換にデータを秘匿する性質(データ秘匿性)があることを示した.カーネル値に基づく学習を安全に委託するためのスキームを示し,次いで,委託スキームに基づいた連合学習のフレームワークを提示した. 区間検索 (range search) は配列の一部分の要素に対して最大値等を計算する処理である.区間に関する情報を秘匿する単純な方法としては配列全体を読み込むものがあるが,通信量が多くなる.この問題に対し,セグメント木というデータ構造を用いることで通信量を削減した.区間に関する情報を秘匿するために,木の子ノードをランダムに並び替える処理を行っている.これにより,単純な方法より100倍高速にしている. 秘密分散以外にも,完全準同型暗号についても高速化を行った.完全準同型暗号は速度が非常に遅いため,実用的とは言えない.そこで様々なアルゴリズムの基本となる,ソートの高速化を行った.これまでは比較演算とソーティングネットワークを用いたアルゴリズムが知られているが,本研究では計数ソートを提案し,高速化を実現した. 秘密分散法に基づく秘匿計算ライブラリ csclib を開発し,その Python 版を公開した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究のテーマである,「圧縮秘匿計算」のための基本的な技術が開発できた.計算の高速化のための最も基本的な技術として二分探索がある.これは配列中の値を検索する際に全ての値を調べるのではなく一部の値のみを参照するだけで検索を行う手法だが,このような高速化は暗号化された値に対しては行いにくい.なぜなら配列のどの要素を参照したかという情報から,検索したい値についての情報が漏れてしまうからである.そのような情報を漏らさずに配列のアクセスを実現する分散 ORAM というデータ構造があるが,既存のものは効率があまり良くなかった.本研究ではこれを改善した. さらに,文字列データベースの検索に対し,二分探索アルゴリズムを用いた検索手法を提案した.これにより,検索したい文字列の長さに比例する回数の二分探索で,文字列を検索できるようになった.これは,分散 ORAM を単純に用いる場合よりも効率が良い. また,完全準同型暗号についても高速化を行ったが,その手法は秘密分散で用いられているものに基づくものである.これは,秘密分散法と完全準同型暗号という異なる手法に基づく秘匿計算を統一したアルゴリズムの開発に繋がる成果であり,今後の発展が期待できる.
|
Strategy for Future Research Activity |
二分探索に基づく文字列検索のアルゴリズムとデータ構造を改良し,圧縮した文字列からの検索を実現する.そのためには,単調増加数列を圧縮して格納する必要がある.ただし,圧縮後のサイズから値に関する情報が漏れないようにするためにする必要があり,そのようなデータの圧縮法を考案する. 機械学習においてもプライバシーの保護が重要であり,秘匿計算が必要となる.情報を秘匿しつつ高速に学習を行うアルゴリズムの開発を行う. 開発中のライブラリ csclib の機能追加を行う.
|