2012 Fiscal Year Research-status Report
プライバシー保護のための個人情報の検知および照合技術の研究
Project/Area Number |
23500082
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
吉浦 裕 電気通信大学, 情報理工学(系)研究科, 教授 (40361828)
|
Co-Investigator(Kenkyū-buntansha) |
内海 彰 電気通信大学, 情報理工学(系)研究科, 准教授 (30251664)
|
Keywords | 情報セキュリティ / ネットワークセキュリティ / プライバシー保護 |
Research Abstract |
ソーシャルメディアを通じた個人情報の漏洩を防止するために、メディアに発信しようとするコンテンツ(日本語文章)を検査して個人情報の漏洩を検知する技術を検討し、以下の成果を得た。 (1)従来方式における無駄な検査を除くと共に、個人情報の顕在化につながるキーワードを抽出することで、検知の処理時間を1/20に低減する一方、検知率を60%から76%へと向上させた。(2)従来は1文単位の処理のみ可能であったが、検知確信度の積算方式を検討し、複数文章から漏洩検知を可能とした。(3)従来の検知方式は、検知するべき個人情報(たとえば勤務する企業やかかっている病名)を用いるので、その知識ベースの作成に手間がかかり、実用性が低かった。そこで、検知するべき個人情報の代わりに、検知するべき個人情報の種別(勤務情報、健康情報)を用いる方式を検討し、mixiに発信された文章を例として事前評価し、具体化の見通しを得た。(4)機械学習を用いた従来の個人情報検知方式を実装し、提案方式との比較により、各々の長所と短所を明らかにした。これにより機械学習を用いる従来方式と提案方式の最適な組合せの検討を開始した。 複数の個人情報のLinking(照合)によって個人の特定に至る危険性を検知し、警告するために、情報間Linking方式を検討し、以下の成果を得た。 (5)個人のプロフィール情報(履歴書に相当する情報)とソーシャルメディア上の日本語文章を各々ベクトル形式に変換し、ベクトルの類似度を算出する方式を確立した。その際、プロフィールにおける学校名とソーシャルメディアにおける通学駅名のような間接的な類似性の定量化を可能とした。12名の被験者を対象として、Twitterの100人のつぶやきの中から、被験者のプロフィールに該当するつぶやきを正解率94%で選択できることを確認した。この種のLinking技術は世界初である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画では平成24年度までの目標として下記を掲げていた。 (1)ソーシャルメディアに発信されたコンテンツからの個人情報の検知 具体的には、複数の文書からの検知、処理時間の1/20への低減、検知率の60%から80%への向上、mixiおよびTwitterのコンテンツを用いた評価 (2)個人情報を含む2種類のコンテンツの間のLinking方式を確立 具体的には、コンテンツのベクトル表現、ベクトル間の類似度算出 上記(1)に対し、【研究実績の概要】で述べたように、複数文章からの検知、処理時間1/20、mixiおよびTwitterのコンテンツを用いた評価、コンテンツのベクトル表現、ベクトル間の類似度算出を達成した。検知率については76%まで向上した。上記(2)に対し、Twitterの多数つぶやきの中から特定プロフィールに対応するつぶやきを特定可能とした。
|
Strategy for Future Research Activity |
(1)ソーシャルメディアに発信されたコンテンツからの個人情報の検知について これまでに処理時間の1/20への低減を達成したが、複数文章にわたる検知処理を行うと数分かかる。そのため、実用化に向けて処理時間1/100への低減を目指す。また、検知するべき個人情報を事前に知識ベース化する手間が実用化のネックになることが明らかになった。24年度には個人情報の代わりの個人情報の種別情報のみを知識ベース化する方式を提案したので、今後は提案方式の評価と改良を行う。従来の機械学習との比較を行い長所短所を明らかにしたので、今後は最適な組み合わせ方式を検討する。 (2)個人情報間のLinkingについて 24年度には、Twitterの多数つぶやきの中から特定プロフィールに対応するつぶやきを特定可能とした。つまり、多数のコンテンツの中から注目者のものを特定可能とした。今後は、この逆のLinkingつまり多数の候補者の中から注目コンテンツの発信者を特定可能とする。これはプライバシー保護の観点ではより重要な課題である。また提案方式を一般化し、つぶやき以外のコンテンツのLinkingや3つ以上のコンテンツのLinkingを可能にする。 以上の検討結果を国内学会、国際学会で発表すると共に、学術雑誌に論文を投稿する。
|
Expenditure Plans for the Next FY Research Funding |
上記の推進方策に沿って研究を進めるために、以下のように研究費を使用する。 (1)国内旅費200千円(50千円×4回):成果発表および情報収集のため (2)外国旅費500千円(250千円×2回):成果発表および情報収集のため (3)謝金等450千円(延450人・時間):実装・評価の補助 (4)学会参加費160千円(40千円×4回) (5)英語論文校閲120千円(40千円×3回)
|
Research Products
(7 results)