2022 Fiscal Year Annual Research Report
Big Data Processing with Compressed Secure Computation
Project/Area Number |
21H05052
|
Research Institution | The University of Tokyo |
Principal Investigator |
定兼 邦彦 東京大学, 大学院情報理工学系研究科, 教授 (20323090)
|
Co-Investigator(Kenkyū-buntansha) |
坂本 比呂志 九州工業大学, 大学院情報工学研究院, 教授 (50315123)
清水 佳奈 早稲田大学, 理工学術院, 教授 (60367050)
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
申 吉浩 学習院大学, 付置研究所, 教授 (60523587)
|
Project Period (FY) |
2021-07-05 – 2026-03-31
|
Keywords | 秘匿計算 |
Outline of Annual Research Achievements |
・ソートアルゴリズムの通信量の削減 ソート(データを小さい順に並び替える)はデータの処理において最も重要な処理と言ってよく,多くの計算の内部で使われる.本研究で開発したソートアルゴリズムは,基数ソート (radix sort) に基づいている.これは,数を2進数で表現した際に,まず最下位のビットに基づきソートを行い,次に下から2番目のビットに基づきソートし,というように桁ごとにソートを行うものである.これをそのまま実行すると W ビットの数のソートは W 回のラウンドを必要とする.これを高速化するには1回のラウンドで複数ビットを処理する必要がある.1回に L ビットに基づきソートを行えばラウンド数は W/L に削減される.しかし秘匿計算においては,複数ビットに基づくソートを行う際には問題が生じる.それは,1回のラウンドあたりの通信量が増大してしまうという点である.既存手法では,1ラウンドあたり O(2^L N log N) ビットのオンライン通信量が必要であったが,これを O(NL) ビットに削減した. ・秘匿接尾辞ソーティング 本研究では,入力文字列の全ての接尾辞をソートするアルゴリズムを開発した.通常の計算モデルでは,長さ n の文字列に対し線形(O(n))時間で接尾辞をソートすることができるが,秘匿計算モデルでは効率的な(O(n^2) よりも高速な)アルゴリズムは存在しなかった.本研究では O(n log^2 n) 時間の秘匿計算アルゴリズムを与えた.ラウンド数は O(log^2 n), 通信量は O(n log^3 n) ビットである.このアルゴリズムは,平文計算における接尾辞ソートアルゴリズムの中でもダブリングという手法に基づくアルゴリズムを用いており,これは秘匿計算と親和性が高く,効率的なアルゴリズムの開発が可能となった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
秘匿計算に限らず,全ての計算での基本であるソートアルゴリズムについて,通信量の削減ができた.このアルゴリズムを用いて,様々なアルゴリズムの改善が行える.
|
Strategy for Future Research Activity |
引き続き,ビッグデータに対する効率的な秘匿計算アルゴリズムの開発を行う.個別のアルゴリズムの開発の他に,秘匿計算アルゴリズムの汎用的な開発法についても検討する.これまでの研究から,外部記憶モデルと並列計算モデルで効率的なアルゴリズムが存在する場合,多くの場合には効率的な秘匿計算アルゴリズムが存在することが分かってきた.よって今後は,外部記憶モデルと並列計算モデルの任意のアルゴリズムが与えられたときに,それを半自動的に秘匿計算モデルでのアルゴリズムに変換する手法の開発を目指す.その過程で,うまく変換できないアルゴリズムが見つかった場合には,その原因を調査する.その結果,秘匿計算の本質的な難しさが判明する可能性もあるが,多くの場合には秘匿計算アルゴリズムは簡単に開発できるようになると考えている.これにより,アルゴリズムの研究者でなくとも容易に秘匿計算アルゴリズムが開発できるようになることを目指す.
|