圧縮秘匿計算による大規模データ処理

研究課題

研究課題/領域番号	21H05052
研究種目	基盤研究(S)
配分区分	補助金
審査区分	大区分J
研究機関	東京大学
研究代表者	定兼邦彦東京大学, 大学院情報理工学系研究科, 教授 (20323090)
研究分担者	坂本比呂志九州工業大学, 大学院情報工学研究院, 教授 (50315123) 清水佳奈早稲田大学, 理工学術院, 教授 (60367050) 渋谷哲朗東京大学, 医科学研究所, 教授 (60396893) 申吉浩学習院大学, 付置研究所, 教授 (60523587) 神保洸貴東京理科大学, 創域理工学部情報計算科学科, 助教 (80966630)
研究期間 (年度)	2021-07-05 – 2026-03-31
研究課題ステータス	交付 (2025年度)
配分額 *注記	158,990千円 (直接経費: 122,300千円、間接経費: 36,690千円) 2025年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円) 2024年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円) 2023年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円) 2022年度: 30,680千円 (直接経費: 23,600千円、間接経費: 7,080千円) 2021年度: 36,270千円 (直接経費: 27,900千円、間接経費: 8,370千円)
キーワード	秘匿計算 / 簡潔データ構造 / 学習
研究開始時の研究の概要	「圧縮秘匿計算」という新概念を提案する．これは次のような概念である．(a) 秘匿計算：個人のプライバシーを保護するためにデータを暗号化したまま保存，計算する．(b) 圧縮索引：データに付加する補助情報を圧縮することで大規模データを省資源の計算機で高速に処理する．(c) 圧縮計算：データを圧縮することで冗長性を排除し，データからの学習・解析の性能・速度を向上させる．この技術を個人ゲノム医療解析，自然言語等の非定型データの解析に応用する．
研究実績の概要	秘密分散に基づく秘匿計算として，配列へのランダムアクセスを可能にするORAM，データ圧縮に用いる可変長符号の符号化・復号化，グループに分割されたデータのソート，AESを用いた暗号化についてそれぞれ効率的なプロトコルを開発した． Function Secret Sharing という手法を用い，秘密分散法を用いて格納された文字列からの全文検索と，決定木評価のためのプロトコルを開発した．連合学習は，複数のパーティが自身の保有するデータを公開することなく，統合されたデータの学習を可能とすることを目的する技術である．データのカーネル値への変換にデータを秘匿する性質（データ秘匿性）があることを示した．カーネル値に基づく学習を安全に委託するためのスキームを示し，次いで，委託スキームに基づいた連合学習のフレームワークを提示した．区間検索 (range search) は配列の一部分の要素に対して最大値等を計算する処理である．区間に関する情報を秘匿する単純な方法としては配列全体を読み込むものがあるが，通信量が多くなる．この問題に対し，セグメント木というデータ構造を用いることで通信量を削減した．区間に関する情報を秘匿するために，木の子ノードをランダムに並び替える処理を行っている．これにより，単純な方法より100倍高速にしている．秘密分散以外にも，完全準同型暗号についても高速化を行った．完全準同型暗号は速度が非常に遅いため，実用的とは言えない．そこで様々なアルゴリズムの基本となる，ソートの高速化を行った．これまでは比較演算とソーティングネットワークを用いたアルゴリズムが知られているが，本研究では計数ソートを提案し，高速化を実現した．秘密分散法に基づく秘匿計算ライブラリ csclib を開発し，その Python 版を公開した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究のテーマである，「圧縮秘匿計算」のための基本的な技術が開発できた．計算の高速化のための最も基本的な技術として二分探索がある．これは配列中の値を検索する際に全ての値を調べるのではなく一部の値のみを参照するだけで検索を行う手法だが，このような高速化は暗号化された値に対しては行いにくい．なぜなら配列のどの要素を参照したかという情報から，検索したい値についての情報が漏れてしまうからである．そのような情報を漏らさずに配列のアクセスを実現する分散 ORAM というデータ構造があるが，既存のものは効率があまり良くなかった．本研究ではこれを改善した．さらに，文字列データベースの検索に対し，二分探索アルゴリズムを用いた検索手法を提案した．これにより，検索したい文字列の長さに比例する回数の二分探索で，文字列を検索できるようになった．これは，分散 ORAM を単純に用いる場合よりも効率が良い．また，完全準同型暗号についても高速化を行ったが，その手法は秘密分散で用いられているものに基づくものである．これは，秘密分散法と完全準同型暗号という異なる手法に基づく秘匿計算を統一したアルゴリズムの開発に繋がる成果であり，今後の発展が期待できる．
今後の研究の推進方策	二分探索に基づく文字列検索のアルゴリズムとデータ構造を改良し，圧縮した文字列からの検索を実現する．そのためには，単調増加数列を圧縮して格納する必要がある．ただし，圧縮後のサイズから値に関する情報が漏れないようにするためにする必要があり，そのようなデータの圧縮法を考案する．機械学習においてもプライバシーの保護が重要であり，秘匿計算が必要となる．情報を秘匿しつつ高速に学習を行うアルゴリズムの開発を行う．開発中のライブラリ csclib の機能追加を行う．
評価記号	中間評価所見 (区分) A: 研究領域の設定目的に照らして、期待どおりの進展が認められる

報告書

(7件)

2023 研究概要(中間評価) ( PDF ) 実績報告書中間評価(所見) ( PDF )
2022 実績報告書
2021 研究概要(採択時) ( PDF ) 審査結果の所見 ( PDF ) 実績報告書

研究成果
(46件)

すべて 2024 2023 2022 2021 その他

すべて国際共同研究 (2件) 雑誌論文 (21件) (うち国際共著 4件、査読あり 21件、オープンアクセス 11件) 学会発表 (20件) (うち国際学会 7件、招待講演 3件) 備考 (3件)

[国際共同研究] University of Copenhagen(デンマーク)
- 関連する報告書
  2023 実績報告書
[国際共同研究] IIT Delhi(インド)
- 関連する報告書
  2023 実績報告書
[雑誌論文] Constant-Round Private Decision Tree Evaluation for Secret Shared Data2024
- 著者名/発表者名
  Cheng Nan、Gupta Naman、Mitrokotsa Aikaterini、Morita Hiraku、Tozawa Kazunari
- 雑誌名
  
  Proceedings on Privacy Enhancing Technologies
  
  巻: 2024 号: 1 ページ: 397-412
- DOI
  10.56553/popets-2024-0023
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Synthetic Data Generation Without Real Data: Uncovering Insights in Malware Detection2024
- 著者名/発表者名
  Liu Chris、Maeda Katsuyuki、Takai Junnosuke、Murota Keisuke、Shin Kilho
- 雑誌名
  
  Lecture Notes in Networks and Systems Advances in Information and Communication
  
  巻: - ページ: 235-255
- DOI
  10.1007/978-3-031-53963-3_17
- ISBN
  9783031539626, 9783031539633
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Prediction of specific surface area of metal?organic frameworks by graph kernels2024
- 著者名/発表者名
  Morikawa Yu、Shin Kilho、Kubouchi Masataka、Ohshima Hiroaki
- 雑誌名
  
  The Journal of Supercomputing
  
  巻: ー号: 9 ページ: 13027-13047
- DOI
  10.1007/s11227-024-05914-3
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Efficient Privacy Preserving Range Query Using Segment Tree2024
- 著者名/発表者名
  Shirotake Shusuke、Shimizu Kana
- 雑誌名
  
  Proceedings of 58th Annual Conference on Information Sciences and Systems (CISS)
  
  巻: - ページ: 1-6
- DOI
  10.1109/ciss59072.2024.10480202
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Single-Shuffle Card-Based Protocol with Eight Cards per Gate2023
- 著者名/発表者名
  Tozawa Kazunari、Morita Hiraku、Mizuki Takaaki
- 雑誌名
  
  UCNC 2023, Lecture Notes in Computer Science
  
  巻: 14003 ページ: 171-185
- DOI
  10.1007/978-3-031-34034-5_12
- ISBN
  9783031340338, 9783031340345
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Genetic algorithm-based feature selection with manifold learning for cancer classification using microarray data2023
- 著者名/発表者名
  Wang Zixuan、Zhou Yi、Takagi Tatsuya、Song Jiangning、Tian Yu-Shi、Shibuya Tetsuo
- 雑誌名
  
  BMC Bioinformatics
  
  巻: 24 号: 1
- DOI
  10.1186/s12859-023-05267-3
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Unbiased Locally Private Estimator for Polynomials of Laplacian Variables2023
- 著者名/発表者名
  Hillebrand Quentin、Suppakitpaisarn Vorapong、Shibuya Tetsuo
- 雑誌名
  
  Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
  
  巻: - ページ: 741-751
- DOI
  10.1145/3580305.3599537
- 関連する報告書
  2023 実績報告書
- 査読あり / 国際共著
[雑誌論文] Privacy-Preserving Genomic Statistical Analysis Under Local Differential Privacy2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  LNCS
  
  巻: 13942 ページ: 40-48
- DOI
  10.1007/978-3-031-37586-6_3
- ISBN
  9783031375859, 9783031375866
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Privacy-Preserving Publication of GWAS Statistics using Smooth Sensitivity2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  Proc. PST
  
  巻: - ページ: 1-12
- DOI
  10.1109/pst58708.2023.10320160
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] A Joint Permute-and-Flip and Its Enhancement for Large-Scale Genomic Statistical Analysis2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  IEEE International Conference on Data Mining Workshops
  
  巻: - ページ: 217-226
- DOI
  10.1109/icdmw60847.2023.00034
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] The Fine-Grained Complexity of?Approximately Counting Proper Connected Colorings (Extended Abstract)2023
- 著者名/発表者名
  Barish Robert D.、Shibuya Tetsuo
- 雑誌名
  
  Combinatorial Optimization and Applications
  
  巻: - ページ: 123-136
- DOI
  10.1007/978-3-031-49614-1_8
- ISBN
  9783031496134, 9783031496141
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Privacy-Preserving Statistical Analysis of Genomic Data Using Compressive Mechanism with Haar Wavelet Transform2023
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  Journal of Computational Biology
  
  巻: 30 号: 2 ページ: 176-188
- DOI
  10.1089/cmb.2022.0246
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Private Evaluation of a Decision Tree based on Secret Sharing2023
- 著者名/発表者名
  Mohammad Nabil Ahmed, Kana Shimizu
- 雑誌名
  
  Information Security and Cryptology - ICISC 2022, 25th International Conference, ICISC 2022, Seoul, South Korea, November 30–December 2, 2022, Revised Selected Papers
  
  巻: 13849 ページ: 186-209
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Privacy-Preserving Feature Selection with Fully Homomorphic Encryption2022
- 著者名/発表者名
  Ono Shinji、Takata Jun、Kataoka Masaharu、I Tomohiro、Shin Kilho、Sakamoto Hiroshi
- 雑誌名
  
  Algorithms
  
  巻: 15 号: 7 ページ: 229-229
- DOI
  10.3390/a15070229
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] A Compression-Based Multiple Subword Segmentation for Neural Machine Translation2022
- 著者名/発表者名
  Nonaka Keita、Yamanouchi Kazutaka、I Tomohiro、Okita Tsuyoshi、Shimada Kazutaka、Sakamoto Hiroshi
- 雑誌名
  
  Electronics
  
  巻: 11 号: 7 ページ: 1014-1014
- DOI
  10.3390/electronics11071014
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Efficient Privacy-Preserving Variable-Length Substring Match for Genome Sequence2021
- 著者名/発表者名
  Yoshiki Nakagawa, Satsuya Ohata, Kana Shimizu
- 雑誌名
  
  Proceedings of WABI
  
  巻: LIPIcs 201
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Compression of Multiple k-Mer Sets by Iterative SPSS Decomposition2021
- 著者名/発表者名
  Kazushi Kitaya and Tetsuo Shibuya
- 雑誌名
  
  Proceedings of WABI
  
  巻: LIPIcs 201
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] More practical differentially private publication of key statistics in GWAS2021
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  Bioinformatics Advances
  
  巻: 1 号: 1 ページ: 1-10
- DOI
  10.1093/bioadv/vbab004
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] UDON: Unsupervised Data SelectiON for Biomedical Entity Recognition2021
- 著者名/発表者名
  Akdemir Arda、Shibuya Tetsuo
- 雑誌名
  
  Proceedings of 4th International Conference on Computing and Big Data (ICCBD)
  
  巻: ACM ページ: 1-7
- DOI
  10.1145/3507524.3507525
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Differentially Private Linkage Analysis with TDT ? the case of two affected children per family2021
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  Proceedings of BIBM
  
  巻: IEEE ページ: 765-770
- DOI
  10.1109/bibm52615.2021.9669365
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Efficient Differentially Private Methods for a Transmission Disequilibrium Test in Genome Wide Association Studies2021
- 著者名/発表者名
  Yamamoto Akito、Shibuya Tetsuo
- 雑誌名
  
  Proceedings of Pacific Symposium on Biocomputing
  
  巻: World Scientific ページ: 85-96
- DOI
  10.1142/9789811250477_0009
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[学会発表] Function Secret Sharing を用いた秘匿全文検索2024
- 著者名/発表者名
  内山智貴，清水佳奈
- 学会等名
  暗号と情報セキュリティシンポジウム（SCIS2024)
- 関連する報告書
  2023 実績報告書
[学会発表] 可変長符号を用いたデータ圧縮の秘匿化2024
- 著者名/発表者名
  瀬戸友暁, 定兼邦彦, 戸澤一成
- 学会等名
  暗号と情報セキュリティシンポジウム（SCIS2024)
- 関連する報告書
  2023 実績報告書
[学会発表] 秘匿分割データのソートとその応用2024
- 著者名/発表者名
  戸澤一成, 諌山航太, 定兼邦彦
- 学会等名
  暗号と情報セキュリティシンポジウム（SCIS2024)
- 関連する報告書
  2023 実績報告書
[学会発表] ツリーベース型マルチサーバORAMのラウンド数削減とその応用2024
- 著者名/発表者名
  諌山航太, 定兼邦彦, 戸澤一成
- 学会等名
  暗号と情報セキュリティシンポジウム（SCIS2024)
- 関連する報告書
  2023 実績報告書
[学会発表] 完全準同型暗号における計数ソートベースのソートプロトコル2024
- 著者名/発表者名
  西村拓海, 戸澤一成, 定兼邦彦
- 学会等名
  情報処理学会コンピュータセキュリティ研究会
- 関連する報告書
  2023 実績報告書
[学会発表] Toward Privacy Preserving Biomedical Data Analysis2023
- 著者名/発表者名
  渋谷哲朗
- 学会等名
  the 10th International Conference on Biomedical and Bioinformatics Engineering
- 関連する報告書
  2023 実績報告書
- 国際学会 / 招待講演
[学会発表] Texture Image Classification Using Earth Mover’s Dista2023
- 著者名/発表者名
  Reo Otsu, Hiroshi Sakamoto
- 学会等名
  11th International Symposium on Applied Engineering and Sciences
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Privacy Preserving Feature Selection2023
- 著者名/発表者名
  Koki Wakiyama, Hiroshi Sakamoto, Tomohiro I
- 学会等名
  11th International Symposium on Applied Engineering and Sciences
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Improved fast image generation from DCT coefficients2023
- 著者名/発表者名
  Yuki Haraguchi, Hiroshi Sakamoto
- 学会等名
  11th International Symposium on Applied Engineering and Sciences
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 生命情報を安全に活用するプライバシ保護データマイニング2023
- 著者名/発表者名
  清水佳奈
- 学会等名
  バイオメディカル・ファジィ・システム学会第36回年次大会
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] 決定木評価のFunction Secret Sharingプロトコルの計算量の改善および並列化2023
- 著者名/発表者名
  高寺俊喜, 定兼邦彦, 戸澤一成
- 学会等名
  コンピュータセキュリティシンポジウム
- 関連する報告書
  2023 実績報告書
[学会発表] 秘密分散ベース秘匿AES計算2023
- 著者名/発表者名
  森田啓, 定兼邦彦, Peter Scholl, 戸澤一成
- 学会等名
  コンピュータセキュリティシンポジウム
- 関連する報告書
  2023 実績報告書
[学会発表] 秘密計算における可変長符号の符号化と復号2023
- 著者名/発表者名
  瀬戸友暁, 定兼邦彦, 戸澤一成
- 学会等名
  情報セキュリティ研究会
- 関連する報告書
  2023 実績報告書
[学会発表] 秘匿接尾辞ソーティングとその応用2023
- 著者名/発表者名
  神保洸貴, 定兼邦彦
- 学会等名
  暗号と情報セキュリティシンポジウム (SCIS)
- 関連する報告書
  2022 実績報告書
[学会発表] 秘密計算基数ソートの通信量の削減2023
- 著者名/発表者名
  吉田勇輝, 定兼邦彦, 戸澤一成
- 学会等名
  暗号と情報セキュリティシンポジウム (SCIS)
- 関連する報告書
  2022 実績報告書
[学会発表] 秘密計算基数ソートの通信量の削減2022
- 著者名/発表者名
  吉田勇輝，定兼邦彦
- 学会等名
  情報処理学会アルゴリズム研究会 AL187-7
- 関連する報告書
  2021 実績報告書
[学会発表] データ圧縮の機械学習と秘匿計算への応用2022
- 著者名/発表者名
  坂本比呂志
- 学会等名
  第120回人工知能基本問題研究会
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] Neural machine translation using subword segmentation with probabilistic locally consistent parsing2021
- 著者名/発表者名
  Keita Nonaka, Hiroshi Sakamoto, Tomohiro I
- 学会等名
  9th International Symposium on Applied Engineering and Sciences (SAES2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Evaluating the execution time of an efficient multiparty sorting protocol on TFHE2021
- 著者名/発表者名
  Jun Takata, Shinji Ono, Tomohiro I, Hiroshi Sakamoto
- 学会等名
  9th International Symposium on Applied Engineering and Sciences (SAES2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Secure computing of eigenvalues and eigenvectors using fully homomorphic encryption2021
- 著者名/発表者名
  Kanta Moriyama, Hiroshi Sakamoto
- 学会等名
  9th International Symposium on Applied Engineering and Sciences (SAES2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[備考] 圧縮秘匿計算ライブラリ csclib
- URL
  https://researchmap.jp/sada/csclib
- 関連する報告書
  2023 実績報告書
[備考] Kunihiko Sadakane
- URL
  https://researchmap.jp/sada/
- 関連する報告書
  2021 実績報告書
[備考] 完全準同型暗号(TFHE)のための高機能ライブラリ
- URL
  https://github.com/hiroshi-kyutech/FTHE-tool
- 関連する報告書
  2021 実績報告書

圧縮秘匿計算による大規模データ処理

研究代表者

定兼 邦彦 東京大学, 大学院情報理工学系研究科, 教授 (20323090)

158,990千円 (直接経費: 122,300千円、間接経費: 36,690千円)

現在までの達成度 (区分)

理由

中間評価所見 (区分)

報告書

研究成果

[国際共同研究] University of Copenhagen(デンマーク)

関連する報告書

[国際共同研究] IIT Delhi(インド)

関連する報告書

[雑誌論文] Constant-Round Private Decision Tree Evaluation for Secret Shared Data2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Synthetic Data Generation Without Real Data: Uncovering Insights in Malware Detection2024

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Prediction of specific surface area of metal?organic frameworks by graph kernels2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Efficient Privacy Preserving Range Query Using Segment Tree2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Single-Shuffle Card-Based Protocol with Eight Cards per Gate2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Genetic algorithm-based feature selection with manifold learning for cancer classification using microarray data2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Unbiased Locally Private Estimator for Polynomials of Laplacian Variables2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Privacy-Preserving Genomic Statistical Analysis Under Local Differential Privacy2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Privacy-Preserving Publication of GWAS Statistics using Smooth Sensitivity2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] A Joint Permute-and-Flip and Its Enhancement for Large-Scale Genomic Statistical Analysis2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] The Fine-Grained Complexity of?Approximately Counting Proper Connected Colorings (Extended Abstract)2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Privacy-Preserving Statistical Analysis of Genomic Data Using Compressive Mechanism with Haar Wavelet Transform2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Private Evaluation of a Decision Tree based on Secret Sharing2023

著者名/発表者名

雑誌名

定兼邦彦東京大学, 大学院情報理工学系研究科, 教授 (20323090)