研究課題/領域番号 |
20K11808
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60070:情報セキュリティ関連
|
研究機関 | 信州大学 |
研究代表者 |
山本 博章 信州大学, 学術研究院工学系, 特任教授 (10182643)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 検索可能暗号 / 文字列検索 / 部分文字列検索可能暗号 / DAWG / 正規表現検索 / de Bruijnグラフ / 部分文字列検索 / 簡潔データ構造 / データ構造 / 有限オートマトン / 正規表現 |
研究開始時の研究の概要 |
検索可能暗号とは、暗号化されたデータを暗号化したまま検索する技術である。近年、クラウドサービスの発展により、その重要性が認識され、活発に研究されるようになってきた。その中でも、テキスト文書に出現する任意の文字列を暗号化したまま検索する技術は 部分文字列検索可能暗号と呼ばれる。これは柔軟な検索を可能とするが、安全で効率的な方式の実現が難しい。そのため、この問題の解決に向け、文字列検索問題で開発されてきた先進的データ構造を利用した研究が行われているが、安全性、効率性、検索機能においてまだ十分ではない。本研究課題は、より優れた部分文字列検索可能暗号を開発しようとするものである。
|
研究実績の概要 |
本年は下記の事項を実施した。 正規表現検索に向けた検索可能暗号の拡張:従来法は閉包演算のない正規表現、すなわち連接、和集合演算のみを持つ正規表現に対する手法であった。このような正規表現が表現できる文字列の集合は有限集合だけのため、検索キーワードは文字列の有限集合に限られる。例えば、特定の文字列を含むすべての文字列を検索しようとすると、検索対象は無限集合となり閉包演算のない正規表現では対応できない。通常の正規表現は、連接、和集合に加え閉包演算を持つのが一般的である。本研究は、閉包演算を含めた3つの演算に対応した正規表現に対する検索可能暗号を開発した。閉包演算を導入するに当たって大きな問題は、de Bruijnグラフはテキスト中の文字列をk-gramをノードとし、k-gram(これは、長さの部分文字列)のつながりでグラフ化したデータ構造となっている。そのため、テキスト中でのk-gramの出現位置の情報が欠落し、閉路のあるグラフが出来上がる。正規表現の閉包演算は文字列の繰り返しを表現できるため、これを有限オートマトンに変換するとループのある有限オートマトンが出来上がる。正規表現検索はこの有限オートマトンを検索に使うため、検索時にループが生じてしまう可能性がある。本研究では、その点を改善するためテキスト中に出現する各k-gramの出現数も暗号化した暗号化索引を作成し、検索時にその情報と検索した各k-gramの回数を比較することによりループを解消する手法を開発した。その結果、一般的な正規表現に対応した検索可能暗号が可能となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
部分文字列検索の拡張である正規表現検索について、従来の制限された形から閉包演算を含む通常の正規表現検索に拡張することができた。提案法は、従来法と同様にde Bruijnグラフを用いているため、暗号化索引はコンパクトにできるが、検索に関しては偽陽性を生じる。これは、テキストをde Bruijnで符号化すると、暗号化索引のサイズは小さくなるが、テキストから一部の情報が欠落するためである。提案法を簡易的に実装し、その性能を評価した。安全性の理論的評価については今後の検討事項であるが、適応的安全性を満たすと考えている。開発した手法については、情報セキュリティに関する全国大会で発表している。 さらに、検索の偽陽性を改善するため、暗号化索引のサイズは増えるが、de Bruijnグラフを用いずにテキストを符号化する手法も提案した。これは、テキストに出現するk-gramの位置情報も考慮してテキストを符号化する方法である。以上よりおおむね順調と判断した。
|
今後の研究の推進方策 |
以下の点を点を研究するとともに得られた成果については学会等で発表する。 1.拡張DAWGに基づく部分文字列検索可能暗号の改善に向けた検討:検索効率の面では大規模データに対応できるようにすること、安全性の面では漏洩情報を減らすことを目指す。特に、アクセスパターンやサーチパターンの漏洩に関しては、そこから検索内容を推測できるといった結果もあり、このような情報の秘匿についても検討する。 2.正規表現検索が可能な検索可能暗号の改良と安全性評価:de Bruijnグラフを利用した構成法について、それらの性能を、索引サイズ、検索時間、偽陽性の観点から詳細に解析するとともに安全性について理論的に評価する。これらの要素のすべてを同時に改善することは難しく、どこに重点を置くかで異なる手法が考えられる。その点も含め検討する。さらに、検索効率に関しては実験的評価も併せて行う。
|