Project/Area Number |
21H05052
|
Research Category |
Grant-in-Aid for Scientific Research (S)
|
Allocation Type | Single-year Grants |
Review Section |
Broad Section J
|
Research Institution | The University of Tokyo |
Principal Investigator |
定兼 邦彦 東京大学, 大学院情報理工学系研究科, 教授 (20323090)
|
Co-Investigator(Kenkyū-buntansha) |
坂本 比呂志 九州工業大学, 大学院情報工学研究院, 教授 (50315123)
清水 佳奈 早稲田大学, 理工学術院, 教授 (60367050)
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
申 吉浩 学習院大学, 付置研究所, 教授 (60523587)
神保 洸貴 東京理科大学, 創域理工学部情報計算科学科, 助教 (80966630)
|
Project Period (FY) |
2021-07-05 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥158,990,000 (Direct Cost: ¥122,300,000、Indirect Cost: ¥36,690,000)
Fiscal Year 2024: ¥30,680,000 (Direct Cost: ¥23,600,000、Indirect Cost: ¥7,080,000)
Fiscal Year 2023: ¥30,680,000 (Direct Cost: ¥23,600,000、Indirect Cost: ¥7,080,000)
Fiscal Year 2022: ¥30,680,000 (Direct Cost: ¥23,600,000、Indirect Cost: ¥7,080,000)
Fiscal Year 2021: ¥36,270,000 (Direct Cost: ¥27,900,000、Indirect Cost: ¥8,370,000)
|
Keywords | 秘匿計算 / 簡潔データ構造 / 学習 |
Outline of Research at the Start |
「圧縮秘匿計算」という新概念を提案する.これは次のような概念である.(a) 秘匿計算:個人のプライバシーを保護するためにデータを暗号化したまま保存,計算する.(b) 圧縮索引:データに付加する補助情報を圧縮することで大規模データを省資源の計算機で高速に処理する.(c) 圧縮計算:データを圧縮することで冗長性を排除し,データからの学習・解析の性能・速度を向上させる.この技術を個人ゲノム医療解析,自然言語等の非定型データの解析に応用する.
|
Outline of Annual Research Achievements |
・ソートアルゴリズムの通信量の削減 ソート(データを小さい順に並び替える)はデータの処理において最も重要な処理と言ってよく,多くの計算の内部で使われる.本研究で開発したソートアルゴリズムは,基数ソート (radix sort) に基づいている.これは,数を2進数で表現した際に,まず最下位のビットに基づきソートを行い,次に下から2番目のビットに基づきソートし,というように桁ごとにソートを行うものである.これをそのまま実行すると W ビットの数のソートは W 回のラウンドを必要とする.これを高速化するには1回のラウンドで複数ビットを処理する必要がある.1回に L ビットに基づきソートを行えばラウンド数は W/L に削減される.しかし秘匿計算においては,複数ビットに基づくソートを行う際には問題が生じる.それは,1回のラウンドあたりの通信量が増大してしまうという点である.既存手法では,1ラウンドあたり O(2^L N log N) ビットのオンライン通信量が必要であったが,これを O(NL) ビットに削減した. ・秘匿接尾辞ソーティング 本研究では,入力文字列の全ての接尾辞をソートするアルゴリズムを開発した.通常の計算モデルでは,長さ n の文字列に対し線形(O(n))時間で接尾辞をソートすることができるが,秘匿計算モデルでは効率的な(O(n^2) よりも高速な)アルゴリズムは存在しなかった.本研究では O(n log^2 n) 時間の秘匿計算アルゴリズムを与えた.ラウンド数は O(log^2 n), 通信量は O(n log^3 n) ビットである.このアルゴリズムは,平文計算における接尾辞ソートアルゴリズムの中でもダブリングという手法に基づくアルゴリズムを用いており,これは秘匿計算と親和性が高く,効率的なアルゴリズムの開発が可能となった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
秘匿計算に限らず,全ての計算での基本であるソートアルゴリズムについて,通信量の削減ができた.このアルゴリズムを用いて,様々なアルゴリズムの改善が行える.
|
Strategy for Future Research Activity |
引き続き,ビッグデータに対する効率的な秘匿計算アルゴリズムの開発を行う.個別のアルゴリズムの開発の他に,秘匿計算アルゴリズムの汎用的な開発法についても検討する.これまでの研究から,外部記憶モデルと並列計算モデルで効率的なアルゴリズムが存在する場合,多くの場合には効率的な秘匿計算アルゴリズムが存在することが分かってきた.よって今後は,外部記憶モデルと並列計算モデルの任意のアルゴリズムが与えられたときに,それを半自動的に秘匿計算モデルでのアルゴリズムに変換する手法の開発を目指す.その過程で,うまく変換できないアルゴリズムが見つかった場合には,その原因を調査する.その結果,秘匿計算の本質的な難しさが判明する可能性もあるが,多くの場合には秘匿計算アルゴリズムは簡単に開発できるようになると考えている.これにより,アルゴリズムの研究者でなくとも容易に秘匿計算アルゴリズムが開発できるようになることを目指す.
|
Assessment Rating |
Interim Assessment Comments (Rating)
A: In light of the aim of introducing the research area into the research categories, the expected progress has been made in research.
|