シミュレーション環境との共進化による新しい輻輳制御アルゴリズムの自動生成
Project/Area Number |
21H03414
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 60050:Software-related
|
Research Institution | University of Tsukuba |
Principal Investigator |
阿部 洋丈 筑波大学, システム情報系, 准教授 (00456716)
|
Co-Investigator(Kenkyū-buntansha) |
岡 瑞起 筑波大学, システム情報系, 准教授 (10512105)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2023: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2022: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2021: ¥7,800,000 (Direct Cost: ¥6,000,000、Indirect Cost: ¥1,800,000)
|
Keywords | インターネット / 輻輳制御 / 機械学習 / 共進化 |
Outline of Research at the Start |
既存の輻輳制御アルゴリズムは、専門的な研究者の「経験と勘」に頼って設計されたものであった。研究代表者らは、アルゴリズムそのものと、そのアルゴリズムを検証するためのシミュレーション環境の両方を強化学習により共進化させる手法である POET (Paired Open-Ended Trailblazer) と、文法エラーを避けて効率的に進化的プログラミングを行うための手法である Grammatical Evolution を組み合わせることで、効率的な強化学習を実現し、これまでに無い新たな輻輳制御アルゴリズムの創出を目指す。
|
Outline of Annual Research Achievements |
当年度は以下の2点について重点的に研究を実施した。1つは、評価関数の見直しによるエージェント進化プロセスの改良である。前年度までに実施していた方式(Endo et al. ALIFE 2022)は、生み出されたエージェントの「良さ」を表す指標として、エージェント自身の通信のスループット性能の値のみを使用する関数のみを用いていた。そのため、競合する他の通信の通信を大きく悪化させかねないようなエージェントが多数生き残ってしまうという現象が見られた。そこで、エージェント自身のスループットに加えて、他の通信との公平性指標を考慮に入れた関数の設計と評価に向けた取り組みを行った。
もう1点は、2022年末から急速に社会的な注目を集めた、ChatGPTに代表されるLLM(大規模言語モデル)の活用についての検討である。前年度までに実施していた方式は、Grammatical Evolution を利用しての交叉や突然変異によって新しいエージェントを生成していた。 この方式は、事前に文法を規定するため、文法的に誤っているエージェントを生成することがないという利点がある一方、その文法によって生成されるエージェントの多様性が制限されてしまうという課題もあった。そこで我々は、LLMによってコードを生成させることで、文法的な誤りが少ないという特徴と、文法に縛られないという特徴の両立する方式の検討を実施した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
評価関数の見直しに関しては、実施中にソフトウェアのバグが発覚し、その修正に想定以上の時間を費やすこととなった。現在は、修正の完了したソフトウェアを用いた評価実験を計算機上で実施中である。
LLMを用いたエージェント生成については、当初の予定には無かったものではあるが、順調に進んでいる。現在、LLM関連の技術や論文が多数発表されているが、それらについての調査を継続的に実施しながら、それらの利用方法についての議論・検討を継続的に実施している。
|
Strategy for Future Research Activity |
次年度は、当年度から開始した、LLMを用いたエージェント生成の検討に重点を置いて引き続き研究を行う。対話型AIとしてのLLMを用いた方法では、妥当な出力結果を得やすい一方で、ランダム性の低い「ありきたり」な出力になりがちであるという課題がある。しかし、未知のアルゴリズムを生み出すための鍵は、エージェント群の多様性を高めることであると我々は考えている。そのためにはLLMをどのような形で利用するのが良いか、また、従来行ってきた Grammatical Evolution との組み合わせをどのようにするのが良いか、等についての議論と検討を引き続き実施する。
|
Report
(2 results)
Research Products
(3 results)