多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)是强化学习(Reinforcement Learning, RL)的一个分支,专注于多个智能体在共享环境中通过交互学习策略。与单智能体强化学习不同,MARL 需要考虑智能体之间的合作、竞争或混合关系,这使得问题更加复杂。
1. MARL 的核心问题
MARL 的核心挑战在于如何处理智能体之间的交互和环境的动态变化。以下是 MARL 中的一些关键问题:
-
非平稳性(Non-stationarity):在单智能体 RL 中,环境通常是平稳的(即环境动态不随时间变化)。但在 MARL 中,其他...