研究課題/領域番号 |
25880020
|
研究機関 | 早稲田大学 |
研究代表者 |
森 達哉 早稲田大学, 理工学術院, 准教授 (60708551)
|
研究期間 (年度) |
2013-08-30 – 2015-03-31
|
キーワード | インターネット / 計測 / トラヒック / アルゴリズム / 高速 |
研究概要 |
2013年度は確率的ハッシュテーブル(連想配列)を実現するデータ構造とアルゴリズムの検討およびそのような確率的連想配列を利用した具体的なアプリケーションとして,個々の通信フローに対して,DNSクエリを参照・解析し,対応するサービス名を付与する方式(SFMap)を検討した.SFMap の用途は暗号化されたことにより,中身が不明な通信フローに対し,DNS クエリ・応答に組を解析することでその通信サービスを推定することであり,通信事業者が自社のネットワークの利用状況を把握するのに有用である. 確率的連想配列に関しては2つの Bloom Filter を組み合わせて Matrix を構成する方式(Matfix Filter=MF)を確立した.理論および数値計算による性能評価を行った結果,MF は既存方式と比較して良好な性能を得られることを確認した.具体的には所与のエラー率が与えられた下で {key, value} のタプルを連想配列に入力する際に,極力メモリ消費量を低減しつつも高速にデータの登録・参照が可能な方式である.特に key 数が膨大であり,value 数が比較的小さいようなケースにおいて既存方式に対して有利な性能を有する特徴がある.SFMap に関しては実通信データを用いた精度評価を行い,こちらも良好な性能が得られることを確認した.SFMap については JST ERATO の井上武氏と共著で国内学会で発表を行った他,実通信データを読み込んで所望の処理を実現するソフトウェアを開発した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初計画では(1)確率的連想配列を実現するデータ構造とアルゴリズムの確立と(2)そのような確率的連想配列を利用した具体的なアプリケーションを開発する予定であった.(1)のデータ構造とアルゴリズムに関しては現時点で良好な性能を得られることが実験的に確認できているものの,その理論的裏付けが未検討である.当初の予想に反して性能を出すためにはやや複雑なデータ処理をする必要があったため,その理論解析が煩雑になったことが原因である.(2) に関してはアルゴリズムの検討と実験評価を完了している.
|
今後の研究の推進方策 |
基礎的な方式および具体的なアプリケーションの良好な動作が確認できたので,2014年度は理論解析に力点を置く.理論解析の結果が出た時点で研究成果を論文投稿する予定である.また方式を実装したソフトウェアをオープンソースソフトウェアとして広く公開することも検討している. さらにもう一つの技術課題であるデータ圧縮技術に着手し,基礎的な方式と実験評価を行う.
|