2019 Fiscal Year Research-status Report
Project/Area Number |
19K12209
|
Research Institution | Waseda University |
Principal Investigator |
清水 佳奈 早稲田大学, 理工学術院, 教授 (60367050)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | プライバシ保護 / ゲノム配列検索 / GWAS / 暗号プロトコル / TEE / SGX / 秘密計算 / 秘匿計算 |
Outline of Annual Research Achievements |
近年,爆発的に増加している個人ゲノムデータの取り扱いには高いプライバシのリスクが付随するため,有用なデータが様々な組織に囲い込まれて孤立するサイロ化と呼ばれる現象が多発している.統計や機械学習を用いてゲノム情報を解析する際には,データの種類が豊富でサンプル数が多いほど正確な結果を得ることができるため,サイロ化したデータを安全かつ,効果的に集約し,有用な知見を発見する方法論の開発が強く望まれている.このような背景から本研究では,ゲノム情報を秘匿したまま情報解析を行う方法論の研究を行うことを目的とする.本研究では特に,(1)ゲノム配列検索と(2)ゲノムワイド関連解析の2点を中心的な課題と定め,大規模なデータ解析を安全に実施できる手法の開発を目指す. 2019年度は,(1)については,秘密分散法による全文検索の暗号プロトコルを考案し,そのプロトタイプを実装した.プロトタイプを用いた実験では,長さ一千万のゲノムデータベースへの検索が実際のインターネット環境でも10秒程度となることを確認した.(2)については,Trusted Execution Environmentを実現する技術の一つであるIntel SGXを用いて,ゲノムワイド関連解析(GWAS)を行うことのできる情報分析プラットフォームを考案し,そのプロタイプ実装を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2019年度は,本研究で目的とする(1)ゲノム配列検索の秘匿化と(2)ゲノムワイド関連解析の秘匿化に関して,次の進捗があった. (1)秘密分散法にもとづき,ゲノム配列や医療文書の分析に役立つ秘匿全文検索の暗号プロトコルを考案し,そのプロトタイプを実装した.開発した手法は,事前計算の実施の工夫により,クエリの投入から検索結果を得るまでのオンライン計算に必要な時間計算量,通信量,ラウンド回数がデータベース長に依存せず,クエリ長のみに依存する.一般的な情報検索では,クエリ長はデータベース長と比較して非常に小さいため,ゲノムデータベースのような膨大な情報に対しても非常に高速に動作する.プロトタイプによる実験では,長さ一千万のゲノムデータベースへの検索が実際のインターネット環境でも10秒程度となることを確認した. (2)Trusted Execution Environmentを実現する技術の一つであるIntel SGXを用いて個人ゲノムデータを解析するシステムも開発した.開発したシステムでは,全ゲノム相関解析やデータのクラスタリングを行うことができる他,データのアクセスパターンを秘匿するOblivious RAMを用いる事により,巨大なデータにも高速にアクセスすることができる.データ分析は,ユーザーがJavaScript等のプログラミング言語により記述し,サーバー上のEnclave内に配備した仮想マシンがサーバー側に情報を漏らすことなく実行できる.200人以上のゲノム変異データを用いた実験では,情報保護をしないソフトウェアと同等の時間で解析を行えることを確認した.
上記のように,大規模なゲノムデータ解析の実現に重要な要素技術について,基礎的な方法論の考案からプロトタイプ実装までを達成しており,当初の計画通り進展している.
|
Strategy for Future Research Activity |
現在までのところ,おおむね順調に進展しているため,2020年度も引き続き当初の計画に従って研究を進めていく.ゲノム配列検索については,秘密分散の通信部分も含めた効率的な実装を目指すほか,秘匿全文検索アルゴリズムのさらなる高度化と効率化を検討する.ゲノムワイド関連解析については,TEEによる情報分析システムの出力プライバシの保護を検討する等,さらなる高度化を検討する.
|
Causes of Carryover |
アルゴリズムの研究に使用することを想定していた計算機を実機ではなくレンタルサーバーにして支払いが2020年度に繰り越されたことなどから差額が生じた。2020年度以降の計算機使用料や国際会議での発表費用に使用する予定。
|