研究課題/領域番号 |
16K00301
|
研究機関 | 名古屋工業大学 |
研究代表者 |
松井 俊浩 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (60437093)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | マルチエージェントシステム / 協調問題解決 / 多目的最適化 / 公平性 |
研究実績の概要 |
本研究課題では,コラボレーション支援,電力スマートグリッド,交通や物流の制御,医療施設への搬送計画などで想定される資源割り当てにおいて重要な,多数の参加者の選好の調整を考慮する協調問題解決と制度設計に注目し,それらを融合した問題とその解法について検討している. 初年度の検討として,協調問題解決と多目的最適化を融合した問題とその解法の検討を進めた.多目的最適化問題の解法のアプローチである対話型解法を複数の参加者が交渉を行なう場として捉え,その枠組について検討した.従来の対話型解法は,ユーザからのパラメータ入力にもとづきソルバが解を返す手順を反復することにより,望ましい解を得る.このユーザを複数の参加者の集合,ソルバを調停者とする際の課題を検討した.特に,多目的最適化の指標として公平性を考慮する指標を導入する方法とその影響の基礎的な評価を行なった. また,動的環境における資源割り当てのための,マルチエージェント強化学習に含まれる協調的な行動選択で,参加者の公平性を考慮する方法について検討した.従来の目的が系全体の利益を最大化することに対して,個々の参加者の不平等さの改善を期待し,行動選択の指標を変更することの影響と効果について調査した.特に分散センサ網における観測資源の動的な割り当て問題における未観測領域の削減を例題とした. また,協調問題解決のための分散最適化問題について,公平性を考慮する手法および確率的な解法の改良を検討した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
多目的最適化問題の対話型解法のアプローチを,複数の参加者の利益の調整の場として適用する枠組の検討では,公平性を改善することを意図する指標であるleximinに加重した指標を目的とする最適化問題を導入し,パレート最適性と加重による解品質への影響を実験的に評価した.これにより導入した指標が選好の調整における公平性の改善に寄与する一方で,加重の調整の方法についての課題が明らかとなった. 動的環境におけるマルチエージェント強化学習において,協調的な行動選択に公平性を導入する方法については,行動選択のための最適化の指標を置き換えた解法を評価した.幾つかの簡単な問題設定においては,最貧者の利益を改善する効果が得られた一方で,より複雑な設定に対応するための,学習側における経験の正規化などの課題が明らかとなった. これらの結果は一定の知見を得るものであり,今後の本研究の改善の方向を示すと考えられる.
|
今後の研究の推進方策 |
今年度の検討に基づき,多目的最適化問題の対話型解法に基づくアプローチについては,最適化の指標における加重の方法と複数論点交渉問題の解法との関連,近似的解法の改良を検討してゆく.また,動的環境におけるマルチエージェント強化学習のための公平な行動選択については,参加者の経験の程度を正規化する学習側の改良を検討してゆく. また,次年度の主要な課題として,系の安定な状態を得るための制度設計手法と最適化問題との融合にもとづく多目的最適化に取り組む.制度設計の補助の下で協調問題解決の負担を削減する手法および,制度設計の周辺に協調問題解決手法を配置する枠組の双方のアプローチについて,両者を相補的に活用する手法とその有効性を検討する.
|