• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

テキストの安全な匿名化に関する研究

Research Project

Project/Area Number 25540096
Research InstitutionNara Institute of Science and Technology

Principal Investigator

荒牧 英治  奈良先端科学技術大学院大学, 研究推進機構, 准教授 (70401073)

Co-Investigator(Kenkyū-buntansha) 森田 瑞樹  岡山大学, 医歯(薬)学総合研究科, 准教授 (00519316)
Project Period (FY) 2013-04-01 – 2016-03-31
Keywords自然言語処理 / 医療情報学 / 匿名化 / プライバシー保護
Outline of Annual Research Achievements

現在,医療のIT化が進み,その結果,かつてない大量の臨床データが電子化された状態でストックされつつある.このデータを有効に利用することができれば患者の生活習慣と疾患の相関(例えば,喫煙と癌)や,薬品とその副作用の相関(タミフルと精神障害)について過去類を見ない大規模な調査が可能となり,臨床研究が加速的に進展するとして高い期待が寄せられている.しかし,単にデータを電子化しただけで,大規模な調査が可能となるわけではない.実際に大規模にカルテを共有し解析するためにはこれらを匿名化する必要がある.さらに,電子カルテには自然言語で入力される箇所が相当な割合で存在するため,データをフル活用するためには,まず,文章を匿名化する必要がある.
我々も2006年から匿名化の研究を開始し,2007年ではF値0.98という高い精度で,個人情報を除去に成功している.しかし,このような高精度であってもカルテの提供にあたっては問題が生じる.例えば,「2012年の小児の移植ドナー」など年間に数例しか行われない治療であった場合,個人情報の範囲外である単なる年代と術名の組み合わせから個人を特定可能な場合がある.また,筆記上の特徴から医師が判明可能である可能性もある.
このような個人情報の削除だけでは十分な匿名化と言えない場合に対応するため,本研究では,文章固有の表現を削除することで,文章を特定不可能とする新しいタイプの匿名化を提案した.これは,任意の文字列が最低k回以上出現するようにテキストの一部を削除するものであり,筆者らはこれを<テキストのk匿名化>とよび,そのアルゴリズムについて発表を行った.
さらに,<テキストのk匿名化>を実用化するために必須となる高速化について研究を行った.これらはする論文発表(国内2本)され,さらに,提案する匿名化手法を実装したデバイス(匿名コピー)を開発した.

  • Research Products

    (3 results)

All 2015 Other

All Presentation (2 results) (of which Invited: 2 results) Remarks (1 results)

  • [Presentation] 言語処理がつくる医療と情報のシナジー2015

    • Author(s)
      荒牧英治
    • Organizer
      Synergy!LIVE2015
    • Place of Presentation
      東京都,品川区,品川インターシティ
    • Year and Date
      2015-12-08
    • Invited
  • [Presentation] テキストデータを対象にした医療に関するビッグデータ解析の動向2015

    • Author(s)
      荒牧英治, 増川佐知子, 宮部真衣, 森田瑞樹
    • Organizer
      医療の質安全学会・学際的医療研究入門WS
    • Place of Presentation
      東京都,品川区,赤坂Bizタワー
    • Year and Date
      2015-09-05
    • Invited
  • [Remarks] ソーシャル・コンピューティング研究室

    • URL

      http://sociocom.jp

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi