研究課題/領域番号 |
17KT0044
|
研究機関 | 早稲田大学 |
研究代表者 |
菅原 俊治 早稲田大学, 理工学術院, 教授 (70396133)
|
研究期間 (年度) |
2017-07-18 – 2022-03-31
|
キーワード | マルチエージェントシステム / 分業 / 強化学習 / 自律分散システム / ノルム / 進化計算 |
研究実績の概要 |
情報通信・センサ等のデバイス・機械技術の発展により、実世界をモニタし人間の活動の補助、安全安心の実現をめざしたシステムが導入され、今後も多くの応用が期待される。しかし環境からの大量の情報とイベントに基づき、それらを実時間で処理する必要があり、多数の計算機や制御プログラムを連携・協調させる技術が重要になる。さらに、人間社会に融合したシステムには、故障とシステム更新を想定した頑健性と持続可能性を実現する技術が必須となる。システムの自律的連携の学術的研究は、人工知能の分野では、ソフト・ハードウェアをエージェントとモデル化し、それらの分業や協調による効率化として提案されてきた。しかし、分業を自律的に創発させ、その最適化やチーム組織化をめざした研究、複数の構成要素からなる「人工物システム」の持続可能性を視野に入れた研究は見られない。ここでは特に、社会で継続的に機能させるために、システムの機能の停止や変動を最小限に抑えながら入替え・更新を実現する自律的手法と、分業の機能を活用してシステム持続可能性の向上を追求する。 本研究期間では、昨年に引き続き、継続的運用に必要な定期的メンテナンスなどで抜けたエージェントによる一時的だが大きな効率低下を和らげる手法の提案内容を高度化し、また実験によりその効果を測定した。また、「予め領域分割を行って分業する手法」においてもこれを拡張し、分割形状をなるべく連結とすることを、エージェントの自律的な領域獲得による領域分断を解消しながらも全体の効率を維持する手法を提案した。なお、同様な動作を深層強化学習での可能性も合わせて試みているが、エージェントの自律性から学習しないエージェントや、特定の領域を全エージェントが無視するような行動学習が見られ、今後はこちらについても取り組む予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は、COVID-19の問題による非常事態宣言とそれに伴う、規制や出校停止などの影響を受け、実験やその評価、さらにはその評価に基づくアルゴリズムの高度化を遂行するための時間が十分ではなかった。また、機材購入のタイミングも遅れた。このような状況のもと、また本年度が最終年度の予定であったが、これを延長した。本年度の進行を詳しく述べると、昨年度提案した意図的な計画停止手法の高度化によるさらなる効率化の実現、省エネルギーに向けたエージェントの行動に学習を組み合わせる手法、領域分割手法において環境の変化や障害物の影響などの調査についてはほぼ計画通りに進められ、また領域分割の高度化と効率化については、査読付き国際会議で発表を行った。他方、計画停止手法については、査読付き国際会議に投稿し、採択はされたものの発表は翌年度となった。また、通信制限の導入などはこれから着手する状況である。このため、外部状況を考慮したうえでは順調に進展したと言えるが、当初の計画と比較すると、本年についてはやや遅延があったと言える。
|
今後の研究の推進方策 |
今後は、これまでの研究計画や途中で発見した課題などにしたがって、残りの課題に挑戦する。具体的には、まず(1)省エネルギーを主目的とした冗長エージェントの積極的停止手法の提案を進める。特に、これまでの実験から、セキュリティ巡回タイプのアプリケーションにより効果的であることが分かっており、このタイプに絞って、さらなる効率化を図る。次に、 (2) 形状分割手法において通信制限のある環境への適用を進める。これは、現状で、未着手の問題であり、これを中心に進める。また、当初には含まれていなかった深層強化学習を取り入れた手法についても、研究を進める。外部状況が許せば研究の進行に合わせ、国際・国内会議・論文誌への投稿・発表を進める。
|
次年度使用額が生じた理由 |
COVID-19による緊急事態宣言等による影響により研究が一定期間中断し、さらに再開にも時間を要したため。
|