部分可观测下的等变强化学习
本文研究了自然界中对称模式的识别和分析,以及在物理学和化学结构研究中的应用。通过利用协同多智能体强化学习问题中的欧几里得对称性,设计了具有对称约束的神经网络架构,表现出优越的性能和泛化能力。
原文中文,约300字,阅读约需1分钟。
本文研究了自然界中对称模式的识别和分析,以及在物理学和化学结构研究中的应用。通过利用协同多智能体强化学习问题中的欧几里得对称性,设计了具有对称约束的神经网络架构,表现出优越的性能和泛化能力。