2011 Fiscal Year Annual Research Report
安心・安全な情報提供を可能とするインターネット基盤の構築に関する研究
Project/Area Number |
22500069
|
Research Institution | Keio University |
Principal Investigator |
西 宏章 慶應義塾大学, 理工学部, 准教授 (00365470)
|
Keywords | コンテンツ類似性検索 / ネットワークストリーム保存 / PDF検索 / ハードウエアPPDP |
Research Abstract |
ネットワークストリームを余すところなくキャプチャするSLIMアプリケーションについて、従来libboostを利用した実装がなされていた。これは、パフォーマンスと実装の容易さ(特にSHEMライブラリが洗練されている)ことから採用したが、ポーティングの際に、例えば異なるLinuxディストリビューションでカーネルのバージョンに強く依存するためコンパイルできないといった問題が発生した。そこで、これらを取り除き、一般的なライブラリを利用する変更を加えた。このSLIMにより、ネットワーク上を流れるPDFについて、実際にその内部を解析、Google Distance等を利用した一致度により、そのオリジナリティを解析したり、あるユニークなキーワードをもとに、誰がそのコンテンツに興味を持っているか、さらには、そのコンテンツの類似コンテンツは誰が興味を持ち、どこに存在するかといった解析手法を提案した。この手法は、PDF内部に存在する、XMLで記載されたメタデータを参照し、pdftextでタイプスクリプトが可能であればテキスト情報も利用することができる。このトラフィックとしては、研究室のゲートウェイトラフィックを利用した。 もう一つの観点である、個人情報など完全な公開が望ましくない情報を、そのアプリケーション面からみた重要性ゆえ、安全に公開する手段として、PPDP(Privacy Preserving Data Publishing)と呼ばれる技術が存在する。この処理は一般にo(n^2)の処理遅延が伴うため、データ量が多い処理では処理遅延が膨大となり、スケーラビリティが低い。CAMとキャッシュを利用したアーキテクチャを利用することで、Information Lossと呼ばれる指標において、デメリットがあるが、処理遅延をo(n)に低減する手法を提案し、評価した。提案手法では、現在一般的に利用されているインテルマルチコアプロセッサのシングルプロセッサ処理と比較して、FPGAでは、200倍程度、ASICでは、さらに2,000倍程度の高速化が可能であることが示された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
有害、危険情報の扱いが厳しいため、実際にネットワーク上に存在する問題のあるコンテンツを扱うことが困難である。そこで、ほぼ同じ定義で目的達成・実装が可能なPDFコンテンツに着目した。
|
Strategy for Future Research Activity |
今後は、最終的な目標である、問題のあるコンテンツの精査サーバへの自動リダイレクション手法について研究を進め実装する。また、提案手法の評価のため、NS2を拡張しコンテンツのハンドリングが可能かつ、リダイレクションを可能とする、シミュレーション環境を構築する。
|