2021 Fiscal Year Research-status Report
Study on identifying HTTP communication service type over encrypted transport layer
Project/Area Number |
19K11950
|
Research Institution | Tokyo City University |
Principal Investigator |
塩本 公平 東京都市大学, 情報工学部, 教授 (00535750)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | Webサービス / 暗号化 / パケットキャプチャ / 機械学習 / 教師あり学習 / 半教師あり学習 / 特徴量 |
Outline of Annual Research Achievements |
暗号化されたHTTP通信のサービス特定の検討については,データセットを拡充するため,研究室ネットワーク内にパケットキャプチャ環境を構築し,データ収集を開始した.また,特徴量としてコネクション継続時間,双方向のパケット数とデータ量を抽出するソフトウェアおよびキャプチャデータへのラベル付けのためのブラウザログ分析ソフトウェアを作成し,コネクションのブラウザログと関連付けて,各コネクションのラベル付け作業を行う基盤が完成した.これから継続的にデータ測定を進め,学習データとテストデータを作成する予定である. ネットワーク侵入検知システムへの検討については,これまで提案してきた敵対的自己符号化器を用いたネットワーク侵入検知システムに関して,主に,ラベルを付与しないデータ数がどの程度あれば,提案手法が有効となるかを調べる観点で,より幅広いパラメータで評価を進めた.この結果,提案手法は訓練データセット中のラベル付きデータサンプルの0.1%のみで、多層パーセプトロンベースのネットワーク侵入検知システムと同等の性能を達成できること,ラベル付けするデータサンプルが少ない場合ラベル付けするサンプルをどのように選択しても精度が低下しないこと,アノテーションを行うデータサンプルの選択は提案手法にとって重要ではないこと、自己符号化器の潜在変数ベクトルの次元が10であるとき再現率とF1スコアが最も高くなることを確認した.以上の結果をまとめてジャーナル論文に投稿した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
暗号化されたHTTP通信のサービス特定については,COVID-19感染防止措置として研究室の入出制限などがあったため,ネットワークでのパケットキャプチャ環境の構築に遅延が生じた.このため,データ取得の開始が予定の第1四半期から第4四半期へ遅延した.特徴量としてコネクション継続時間,双方向のパケット数とデータ量を抽出するソフトウェアおよびキャプチャデータへのラベル付けのためのブラウザログ分析ソフトウェアは作成し,データセットの作成を行っているところである.データセットを作成しつつ,提案手法の評価を行い,サービス特定のために有効な特徴量とラベルを付与するデータサンプルの選別方法を評価する.データセット作成法と評価結果をまとめて,12月末までに査読付き国際会議論文に投稿する予定である. ネットワーク侵入検知システムへの応用については,予定通り進捗しており,ラベル付けするデータサンプルが少ない場合ラベル付けするサンプルをどのように選択しても精度が低下しないことなどを明らかにしている.これまでの結果をまとめてジャーナル論文に投稿し査読中である.査読コメントが示されたら,必要に応じて評価を行い,論文を仕上げる.
|
Strategy for Future Research Activity |
暗号化されたHTTP通信のサービス特定については,研究室ネットワークでのパケットキャプチャを継続し,特徴量としてコネクション継続時間,双方向のパケット数とデータ量を抽出するソフトウェアとキャプチャデータへのラベル付けのためのブラウザログ分析ソフトウェアを用いて,データセットの作成を進める.データセットを作成しつつ,提案手法の評価を行い,8月末までに,サービス特定のために有効な特徴量とラベルを付与するデータサンプルの選別方法の評価を完了させる.その後,データセット作成法と評価結果を論文にまとめつつ,必要な評価を追加で行い,12月末までにIEEE NetSoft 2023に投稿する. ネットワーク侵入検知システムへの応用については,予定通り進捗しており,ラベル付けするデータサンプルが少ない場合ラベル付けするサンプルをどのように選択しても精度が低下しないことなどを明らかにしている.これまでの結果をまとめてジャーナル論文に投稿し査読中である.査読コメントが示されたら,必要に応じて評価を行い,論文を仕上げる.
|
Causes of Carryover |
2021年度は,COVID-19感染防止措置として研究室の入出制限などがあったため,暗号化されたHTTP通信のサービス特定の検討については,ネットワークでのパケットキャプチャ環境の構築が遅れ,データ取得の開始が予定の第1四半期から第4四半期へ遅延した.このため,全体的に計画が後ろ倒しになり,年度内に論文をまとめることができなかった.2022年度はこれまでの結果を論文にまとめて,国際会議に投稿するための英文添削や国際会議参加費用に研究費を使用する.
|