研究課題/領域番号 |
19K11950
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60060:情報ネットワーク関連
|
研究機関 | 東京都市大学 |
研究代表者 |
塩本 公平 東京都市大学, 情報工学部, 教授 (00535750)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 暗号化 / Web通信トラフィック / サービスタイプ特定 / 機械学習 / 半教師あり学習 / 特徴量 / ラベル付与 / Web通信サービス特定 / Webサービス / パケットキャプチャ / 教師あり学習 / HTTP / トラヒック分析 |
研究開始時の研究の概要 |
暗号化された多数のコネクションから構成されたWeb通信の計測データを分析し、ユーザが利用しているサービスタイプを特定する手法を確立する。 トランスポートレイヤとネットワークレイヤの計測情報からサービスタイプを示す特徴量を決定し、それらの特徴量からなる特徴ベクトルをもとにサービスタイプを識別するための機械学習アルゴリズムを研究する。 機械学習において人手でのラベル付け作業が必要となる教師データの数を抑えるために、半教師あり学習を適用することが本研究の特徴である。膨大のデータが持つ構造をもとにラベルを付与するデータの決定法とサービスタイプの識別するための特徴ベクトルの領域境界の決定法を明らかにする。
|
研究成果の概要 |
機械学習モデルを用いてサービス特定を行う際に,暗号化されたパケットキャプチャデータから抽出できる特徴量のうち,コネクション毎のバイト数とパケット数に関して最大値,平均値,中間値,および分散がサービス特定に有効な特徴量であることを明らかにした. 半教師あり学習である敵対的自己符号化器を用いたネットワーク侵入検知システムを検討し,訓練データセット中のラベル付きデータサンプルの0.1%のみで,多層パーセプトロンベースのネットワーク侵入検知システムと同等の性能を達成でき,人手でのラベル付け作業が必要となる教師データの数を抑えることができることを明らかにした.
|
研究成果の学術的意義や社会的意義 |
今日のWeb通信は複雑な構造であり,暗号化されたパケットキャプチャデータからWebサービスを特定することは困難であった.本研究の学術的意義は暗号化されたパケットキャプチャデータを機械学習によりサービス特定を行う際に有効な特徴量を明らかにしたこと,半教師あり学習を用いることで人手のかかるデータへのラベル付け作業を削減したことである. 本研究の社会的意義は,暗号化が普及した現在のインターネットで困難であったWebサービスの特定が可能になり,ユーザに提供するサービス体感品質を最適化するために必要なネットワーク性能をネットワーク事業者が把握することが可能となったことである.
|