2020 Fiscal Year Annual Research Report
通信データ独占を克服するための疑似データ生成プラットフォームの構築
Project/Area Number |
20H04172
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
渡部 康平 長岡技術科学大学, 工学研究科, 准教授 (10734733)
|
Co-Investigator(Kenkyū-buntansha) |
津川 翔 筑波大学, システム情報系, 助教 (40632732)
野中 尋史 長岡技術科学大学, 工学研究科, 准教授 (70544724)
中平 勝也 沖縄工業高等専門学校, 情報通信システム工学科, 准教授 (30500566)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | ネットワーク / 敵対的生成ネットワーク / ニューラルネットワーク / 通信データ / トラヒック / ネットワークトポロジ |
Outline of Annual Research Achievements |
本年度においては,主に,下記に示す2つの研究項目に取り組んだ. 1) トラヒック生成技術の開発: 本研究項目では,ネットワーク上を流れるトラヒックの実データを学習し,実データの特性を模擬したトラヒックを無限に生成可能なトラヒック生成器を開発を目指している.本年度は主に,バイトレベル,フローレベル,パケットレベルの3つのレベルそれぞれについて,生成器の開発を進めた.バイトレベルについては,LSTM(Long Short Term Memory)及びGAN(Generative Adversarial Networks)を活用することで平均-分散特性,ハーストパラメータ,周波数特性,自己共分散,KS統計量など多面的な視点から見て類似したトラヒックを生成する技術を確立した.同技術を適用して,パケットレベルの生成器についても開発が進んでいる.フローレベルについては,機械翻訳の技術を転用することにより,IP空間の翻訳を実現したトラヒックの変換技術の開発を進めており,良好な結果を得ている. 2) トポロジ生成技術の開発: 本研究項目では,実ネットワークの繋がり方,トポロジを再現可能なトポロジ生成器の開発を目指している.ネットワークトポロジの生成については,トポロジをDFSコードによりエンコードし,LSTMベースのCVAE(Conditional Variational Autoencoder)の技術を使った生成技術を確立している.統計的生成手法により集めた小規模なデータセットを使い,次数分布のべき指数やクラスタリング係数を調整可能であることを実証し,これらの結果をまとめて,ICDCS 2021 Poster Trackに採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2020年度の実施計画としては,トラヒック,及びネットワークトポロジの両面から研究をスタートし,与えられたデータセットの特性を多面的に模倣する基本的な生成器を確立することが目標となっていた. トラヒックデータの生成に関しては,バイトレベルのトラヒック生成については,LSTM及びGANを活用することで平均-分散特性,ハーストパラメータ,周波数特性,自己共分散,KS統計量など多面的に見て類似したトラヒックを生成する技術を確立することができており,概ね目標を達成していると考えている.パケットレベル及びフローレベルの生成については,上記技術を拡張しつつ,開発を進めているが,一部の特徴量についてのみ類似した生成を実現するにとどまっている. 一方で,トポロジ生成については,DFSコードとLSTM,VAEを組み合わせることにより,当初計画であった類似したトポロジを生成する技術を確立するに至っている.更には,VAEをCVAEに拡張することで,2021年度に実施予定であった任意特徴量の調整の段階も一部の特徴量について実現を確認しており,目標を超える成果が得られていると考えている. 以上のように,本年度の目標を概ね達成し,一部の課題については目標を超える成果を達成していることから,総合的に見て順調に進んでいると考えいている.
|
Strategy for Future Research Activity |
2021年度は引き続きトラヒック生成器とネットワークトポロジ生成器の開発を進める. バイトレベルのトラヒック生成器については,与えられたデータセットと類似した特性を持つトラヒックを生成する方法は確立しているため,任意の特徴量を制御するための拡張を進める.先行しているネットワークトポロジの生成器での知見を活かし,GANまたはVAEを使って特徴量の制御を試みる. パケットレベルのトラヒック生成器については,バイトレベルのトラヒック生成器での成果を元に,多面的な特徴量の模倣を試みる. フローレベルのトラヒック生成については,IP空間の翻訳精度を高めるためにテータの埋め込みの改善に取り組む.GANによる生成のアプローチについても検討し,多面的な模倣を目指す. 一方トラヒック生成器の開発については,現状でつ統計的生成手法により得られた小規模データセットでの特徴量の調整が可能になっているため,大規模データでの検証,及び,実データを使った実証を進める.
|
Research Products
(10 results)