本研究提出了一种基于并发博弈结构的多智能体系统模型,旨在填补因果关系研究的不足,分析智能体策略决策的因果效应,为理解智能体行为提供新视角。
本研究探讨了机器学习中假设因果关系恒定的局限性,提出了元因果状态的概念,用于分析因果图中的变化。通过观察智能体行为推断这些状态,并展示如何从未标记数据中分离。元因果状态可能源自动力系统的内在动态,具有重要应用潜力。
本文提出了一种通用学习框架,用于在多智能体系统中建模智能体行为,仅需少量交互数据。该框架将智能体建模视为表示学习问题,结合模仿学习与智能体识别,设计了无监督学习算法。实验证明该框架在高维竞争和合作环境中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。