研究課題/領域番号 |
21H03414
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 筑波大学 |
研究代表者 |
阿部 洋丈 筑波大学, システム情報系, 准教授 (00456716)
|
研究分担者 |
岡 瑞起 筑波大学, システム情報系, 准教授 (10512105)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2022年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2021年度: 7,800千円 (直接経費: 6,000千円、間接経費: 1,800千円)
|
キーワード | インターネット / 輻輳制御 / 機械学習 / 共進化 |
研究開始時の研究の概要 |
既存の輻輳制御アルゴリズムは、専門的な研究者の「経験と勘」に頼って設計されたものであった。研究代表者らは、アルゴリズムそのものと、そのアルゴリズムを検証するためのシミュレーション環境の両方を強化学習により共進化させる手法である POET (Paired Open-Ended Trailblazer) と、文法エラーを避けて効率的に進化的プログラミングを行うための手法である Grammatical Evolution を組み合わせることで、効率的な強化学習を実現し、これまでに無い新たな輻輳制御アルゴリズムの創出を目指す。
|
研究成果の概要 |
本研究では、強化学習を用いたインターネットの輻輳制御アルゴリズムの自動生成を目指した。POETを活用し、ネットワークシミュレーション環境とアルゴリズムの共進化を行った。初年度にはプロトタイプを構築し、Quality Diversity (QD) の考え方を導入。次年度にはLLM (Large Language Model) を使用して、GE (Grammatical Evolution) の限界を克服するアルゴリズム生成を試みた。評価関数の見直しを行い、公平性を考慮した新たな評価指標を導入した結果、他の通信とバランスを保ちながら高いスループットを維持するエージェントの生成に成功した。
|
研究成果の学術的意義や社会的意義 |
本研究の学術的意義は、機械学習アルゴリズム、特に強化学習を用いて、新たな輻輳制御アルゴリズムを自動生成する点にある。従来の手法では対応が難しい多様なネットワーク環境においても、高性能なアルゴリズムの生成が可能となる。また、環境とアルゴリズムの共進化により、人間の介在なしで効率的なアルゴリズムの開発が進む。社会的意義としては、インターネットサービスの品質向上が挙げられる。動画ストリーミング、オンラインゲーム、IoT、エッジコンピューティングなど多岐にわたる分野で、通信の効率性と公平性を向上させることで、ユーザー体験の大幅な向上が期待される。
|