研究課題/領域番号 |
21H05052
|
研究種目 |
基盤研究(S)
|
配分区分 | 補助金 |
審査区分 |
大区分J
|
研究機関 | 東京大学 |
研究代表者 |
定兼 邦彦 東京大学, 大学院情報理工学系研究科, 教授 (20323090)
|
研究分担者 |
坂本 比呂志 九州工業大学, 大学院情報工学研究院, 教授 (50315123)
清水 佳奈 早稲田大学, 理工学術院, 教授 (60367050)
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
申 吉浩 学習院大学, 付置研究所, 教授 (60523587)
神保 洸貴 東京理科大学, 創域理工学部情報計算科学科, 助教 (80966630)
|
研究期間 (年度) |
2021-07-05 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
158,990千円 (直接経費: 122,300千円、間接経費: 36,690千円)
2024年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円)
2023年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円)
2022年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円)
2021年度: 36,270千円 (直接経費: 27,900千円、間接経費: 8,370千円)
|
キーワード | 秘匿計算 / 簡潔データ構造 / 学習 |
研究開始時の研究の概要 |
「圧縮秘匿計算」という新概念を提案する.これは次のような概念である.(a) 秘匿計算:個人のプライバシーを保護するためにデータを暗号化したまま保存,計算する.(b) 圧縮索引:データに付加する補助情報を圧縮することで大規模データを省資源の計算機で高速に処理する.(c) 圧縮計算:データを圧縮することで冗長性を排除し,データからの学習・解析の性能・速度を向上させる.この技術を個人ゲノム医療解析,自然言語等の非定型データの解析に応用する.
|
研究実績の概要 |
・ソートアルゴリズムの通信量の削減 ソート(データを小さい順に並び替える)はデータの処理において最も重要な処理と言ってよく,多くの計算の内部で使われる.本研究で開発したソートアルゴリズムは,基数ソート (radix sort) に基づいている.これは,数を2進数で表現した際に,まず最下位のビットに基づきソートを行い,次に下から2番目のビットに基づきソートし,というように桁ごとにソートを行うものである.これをそのまま実行すると W ビットの数のソートは W 回のラウンドを必要とする.これを高速化するには1回のラウンドで複数ビットを処理する必要がある.1回に L ビットに基づきソートを行えばラウンド数は W/L に削減される.しかし秘匿計算においては,複数ビットに基づくソートを行う際には問題が生じる.それは,1回のラウンドあたりの通信量が増大してしまうという点である.既存手法では,1ラウンドあたり O(2^L N log N) ビットのオンライン通信量が必要であったが,これを O(NL) ビットに削減した. ・秘匿接尾辞ソーティング 本研究では,入力文字列の全ての接尾辞をソートするアルゴリズムを開発した.通常の計算モデルでは,長さ n の文字列に対し線形(O(n))時間で接尾辞をソートすることができるが,秘匿計算モデルでは効率的な(O(n^2) よりも高速な)アルゴリズムは存在しなかった.本研究では O(n log^2 n) 時間の秘匿計算アルゴリズムを与えた.ラウンド数は O(log^2 n), 通信量は O(n log^3 n) ビットである.このアルゴリズムは,平文計算における接尾辞ソートアルゴリズムの中でもダブリングという手法に基づくアルゴリズムを用いており,これは秘匿計算と親和性が高く,効率的なアルゴリズムの開発が可能となった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
秘匿計算に限らず,全ての計算での基本であるソートアルゴリズムについて,通信量の削減ができた.このアルゴリズムを用いて,様々なアルゴリズムの改善が行える.
|
今後の研究の推進方策 |
引き続き,ビッグデータに対する効率的な秘匿計算アルゴリズムの開発を行う.個別のアルゴリズムの開発の他に,秘匿計算アルゴリズムの汎用的な開発法についても検討する.これまでの研究から,外部記憶モデルと並列計算モデルで効率的なアルゴリズムが存在する場合,多くの場合には効率的な秘匿計算アルゴリズムが存在することが分かってきた.よって今後は,外部記憶モデルと並列計算モデルの任意のアルゴリズムが与えられたときに,それを半自動的に秘匿計算モデルでのアルゴリズムに変換する手法の開発を目指す.その過程で,うまく変換できないアルゴリズムが見つかった場合には,その原因を調査する.その結果,秘匿計算の本質的な難しさが判明する可能性もあるが,多くの場合には秘匿計算アルゴリズムは簡単に開発できるようになると考えている.これにより,アルゴリズムの研究者でなくとも容易に秘匿計算アルゴリズムが開発できるようになることを目指す.
|
評価記号 |
中間評価所見 (区分)
A: 研究領域の設定目的に照らして、期待どおりの進展が認められる
|