トピックモデルと時空間深層学習を用いたトラフィック予測法に関する研究
Project/Area Number |
23K28077
|
Project/Area Number (Other) |
23H03387 (2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2023) |
Section | 一般 |
Review Section |
Basic Section 60060:Information network-related
|
Research Institution | Tokyo City University |
Principal Investigator |
塩本 公平 東京都市大学, 情報工学部, 教授 (00535750)
|
Co-Investigator(Kenkyū-buntansha) |
神野 健哉 東京都市大学, 情報工学部, 教授 (50286762)
大歳 達也 大阪大学, 大学院経済学研究科, 助教 (60804458)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥18,590,000 (Direct Cost: ¥14,300,000、Indirect Cost: ¥4,290,000)
Fiscal Year 2025: ¥5,460,000 (Direct Cost: ¥4,200,000、Indirect Cost: ¥1,260,000)
Fiscal Year 2024: ¥6,890,000 (Direct Cost: ¥5,300,000、Indirect Cost: ¥1,590,000)
Fiscal Year 2023: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
|
Keywords | トラフィック予測 / 機械学習 / トピックモデル / トラフィック計測 / 人流分析 / 通信トラフィック予測 / 深層学習 / 人流 / 時空間 / 時空間深層学習 / 情報ネットワーク |
Outline of Research at the Start |
B5G/6Gではサイバーフィジカルシステム(CPS)の実現により産業の発展・創造や都市・交通問題などの社会課題の解決を目指している.人流や交通流などの移動体を含めさまざまなモノが通信を行うCPSでは,通信トラフィック需要は時空間で複雑に変化するため,従来の予測技術では対応が困難である.そこで,本研究課題では,人口の時空間変動をモデル化し,人口と通信トラフィックの関係をモデル化して予測する方法に取り組む.トピックモデルと時空間深層学習モデルを応用して,トラフィック需要とその変化の背後にあるメカニズムをモデル化し,通信トラフィック需要を予測する方法を研究する.
|
Outline of Annual Research Achievements |
[課題1:トピックモデルを用いたトラフィック需要予測法]に関しては,Latent Dirichret Allocation(LDA)を用いて,ある一定長のウィンドウ時間ごとに観測された全てのコネクションを「文書」として扱い,コネクション毎の特徴量を「文書内の単語」とモデル化する方法を考案した.コネクション毎の特徴量としては通信バイト量を用いた.研究室のネットワークに接続された3台のPCを用いて実験を行い,シナリオに沿ってブラウザでWebサイトにアクセスして,パケットキャプチャデータを収集した.パケットキャプチャデータからコネクション毎の特徴量を抽出し,データセットを作成し,LDAモデルの効果を評価した.コネクションの通信バイト量を分析し,通信バイト量を適切な粒度で離散化し,LDAモデルにおける「単語ID」に変換し,LDAモデルを適用した.評価の結果,今回のデータセットにおいては,ウィンドウ長を40秒,トピック数を6とすることで通信需要の変化を捉えることが明らかになった. [課題2:時空間深層学習モデルを用いた人口の時空間変動予測法]に関しては,ConvLSTMモデルにSelf-Attentionを組み合わせた手法の評価を行った. Milano Gridを用いて, ConvLSTMモデルにSelf-Attentionを組み合わせた人流予測手法を用いて評価した.Milano Gridデータの100×100の全グリッドのデータを用いた学習は計算機のメモリ容量の制限から実行できないため,64×64の領域を抽出して評価した.評価の結果, Self-Attentionを組み合わせることによって,誤差率が収束するまでの必要エポック数が半減することやCPU/GPU使用率も40%軽減することが判明した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
[課題1:トピックモデルを用いたトラフィック需要予測法]に関しては,今年度の目標は次の通りであった.「LDAモデルを用いた定式化(課題1-1)と研究室ネットワークにおいてトラフィックを計測し通信サービスとコネクションの関係性モデルを構築し,シミュレーション結果と照らし合わせてモデルの妥当性を検証する(課題1-2).」 この目標に対して, 今年度は,LDAを用いたモデル化を考案し,研究室のネットワークにおいて計測したトラフィックを用いてLDAモデルの評価を行い,ウィンドウ長とトピック数を変化させることで,各ウィンドウでのトピック混在比率がどのように変わるかの傾向を把握することができ,おおむね計画通りに進捗させることができた.一方で,評価を進める中で,トピックの混在比率の時間推移のモデル化により,トピック混在比率を予測する方法を着想した.また,トピックの混在比率からトラフィック量を推定する方法も着想した. [課題2:時空間深層学習モデルを用いた人口の時空間変動予測法]に関しては,今年度の目標は次の通りであった.「Milan Gridデータセットから人口データの時空間変動モデルを作成し,Conv-LSTMを用いた予測法の性能評価を行う(課題2-1).」 この目標に対して,今年度は, Milano Gridを用いてConvLSTMモデルにSelf-Attentionを組み合わせた人流予測手法を用いた評価に着手し,誤差率とエポック数の関係やCPU/GPU使用率を計測することができ,おおむね計画通りに進捗させることができた.一方で,Milano Gridの100×100のデータを用いた学習は計算機のメモリ容量の制限から実行できないため,小規模のエリアをスライドさせながら大規模エリアをカバーすることで,時空間の人流予測結果を合成する方法を着想した.
|
Strategy for Future Research Activity |
[課題1:トピックモデルを用いたトラフィック需要予測法]に関しては,今後は,あるユーザからの通信トラフィック計測データから,利用している通信サービスの構成比率を特定する方法(課題1-3)と人口と通信中のアクティブユーザとの関係を階層化ベイズモデルでモデル化し,人口からアクティブユーザからの通信トラフィック量を導出する方法(課題1-4)を検討する.その中で,これまで評価を進めてきた中で着想した,トピックの混在比率からトラフィック量を推定する方法に関して,具体的な方式提案に落とし込み,有効性を評価していく. さらに,これまで評価を進めてきた中で着想した,トピックの混在比率の時間推移のモデル化によりトピック混在比率を予測する方法に関しても,具体的な方式提案に落とし込み,有効性を評価していく.
[課題2:時空間深層学習モデルを用いた人口の時空間変動予測法]に関しては,今後は, Transformerを用いた拡張(課題2-2)に取り組む.具体的には,Milano Gridを用いてConvLSTMモデルにSelf-Attentionを組み合わせた人流予測手法を用いた評価を進め,知見をまとめる. さらに,今年度の検討を進める中での着想した,小規模のエリアをスライドさせながら大規模エリアをカバーすることで,時空間の人流予測結果を合成する方法に関して,具体的な方式提案に落とし込み,有効性を評価する.
|
Report
(1 results)
Research Products
(10 results)