2023 Fiscal Year Annual Research Report
トピックモデルと時空間深層学習を用いたトラフィック予測法に関する研究
Project/Area Number |
23H03387
|
Allocation Type | Single-year Grants |
Research Institution | Tokyo City University |
Principal Investigator |
塩本 公平 東京都市大学, 情報工学部, 教授 (00535750)
|
Co-Investigator(Kenkyū-buntansha) |
神野 健哉 東京都市大学, 情報工学部, 教授 (50286762)
大歳 達也 大阪大学, 大学院経済学研究科, 助教 (60804458)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | トピックモデル / 通信トラフィック予測 / 深層学習 / 人流 / 時空間 |
Outline of Annual Research Achievements |
[課題1:トピックモデルを用いたトラフィック需要予測法]に関しては,Latent Dirichret Allocation(LDA)を用いて,ある一定長のウィンドウ時間ごとに観測された全てのコネクションを「文書」として扱い,コネクション毎の特徴量を「文書内の単語」とモデル化する方法を考案した.コネクション毎の特徴量としては通信バイト量を用いた.研究室のネットワークに接続された3台のPCを用いて実験を行い,シナリオに沿ってブラウザでWebサイトにアクセスして,パケットキャプチャデータを収集した.パケットキャプチャデータからコネクション毎の特徴量を抽出し,データセットを作成し,LDAモデルの効果を評価した.コネクションの通信バイト量を分析し,通信バイト量を適切な粒度で離散化し,LDAモデルにおける「単語ID」に変換し,LDAモデルを適用した.評価の結果,今回のデータセットにおいては,ウィンドウ長を40秒,トピック数を6とすることで通信需要の変化を捉えることが明らかになった. [課題2:時空間深層学習モデルを用いた人口の時空間変動予測法]に関しては,ConvLSTMモデルにSelf-Attentionを組み合わせた手法の評価を行った. Milano Gridを用いて, ConvLSTMモデルにSelf-Attentionを組み合わせた人流予測手法を用いて評価した.Milano Gridデータの100×100の全グリッドのデータを用いた学習は計算機のメモリ容量の制限から実行できないため,64×64の領域を抽出して評価した.評価の結果, Self-Attentionを組み合わせることによって,誤差率が収束するまでの必要エポック数が半減することやCPU/GPU使用率も40%軽減することが判明した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
[課題1:トピックモデルを用いたトラフィック需要予測法]に関しては,今年度の目標は次の通りであった.「LDAモデルを用いた定式化(課題1-1)と研究室ネットワークにおいてトラフィックを計測し通信サービスとコネクションの関係性モデルを構築し,シミュレーション結果と照らし合わせてモデルの妥当性を検証する(課題1-2).」 この目標に対して, 今年度は,LDAを用いたモデル化を考案し,研究室のネットワークにおいて計測したトラフィックを用いてLDAモデルの評価を行い,ウィンドウ長とトピック数を変化させることで,各ウィンドウでのトピック混在比率がどのように変わるかの傾向を把握することができ,おおむね計画通りに進捗させることができた.一方で,評価を進める中で,トピックの混在比率の時間推移のモデル化により,トピック混在比率を予測する方法を着想した.また,トピックの混在比率からトラフィック量を推定する方法も着想した. [課題2:時空間深層学習モデルを用いた人口の時空間変動予測法]に関しては,今年度の目標は次の通りであった.「Milan Gridデータセットから人口データの時空間変動モデルを作成し,Conv-LSTMを用いた予測法の性能評価を行う(課題2-1).」 この目標に対して,今年度は, Milano Gridを用いてConvLSTMモデルにSelf-Attentionを組み合わせた人流予測手法を用いた評価に着手し,誤差率とエポック数の関係やCPU/GPU使用率を計測することができ,おおむね計画通りに進捗させることができた.一方で,Milano Gridの100×100のデータを用いた学習は計算機のメモリ容量の制限から実行できないため,小規模のエリアをスライドさせながら大規模エリアをカバーすることで,時空間の人流予測結果を合成する方法を着想した.
|
Strategy for Future Research Activity |
[課題1:トピックモデルを用いたトラフィック需要予測法]に関しては,今後は,あるユーザからの通信トラフィック計測データから,利用している通信サービスの構成比率を特定する方法(課題1-3)と人口と通信中のアクティブユーザとの関係を階層化ベイズモデルでモデル化し,人口からアクティブユーザからの通信トラフィック量を導出する方法(課題1-4)を検討する.その中で,これまで評価を進めてきた中で着想した,トピックの混在比率からトラフィック量を推定する方法に関して,具体的な方式提案に落とし込み,有効性を評価していく. さらに,これまで評価を進めてきた中で着想した,トピックの混在比率の時間推移のモデル化によりトピック混在比率を予測する方法に関しても,具体的な方式提案に落とし込み,有効性を評価していく.
[課題2:時空間深層学習モデルを用いた人口の時空間変動予測法]に関しては,今後は, Transformerを用いた拡張(課題2-2)に取り組む.具体的には,Milano Gridを用いてConvLSTMモデルにSelf-Attentionを組み合わせた人流予測手法を用いた評価を進め,知見をまとめる. さらに,今年度の検討を進める中での着想した,小規模のエリアをスライドさせながら大規模エリアをカバーすることで,時空間の人流予測結果を合成する方法に関して,具体的な方式提案に落とし込み,有効性を評価する.
|