率先解决多类数据同时受损,中科大MIRA团队TRACER入选NeurIPS 2024:强鲁棒性的离线变分贝叶斯强化学习
原文中文,约2900字,阅读约需7分钟。发表于: 。中科大王杰教授团队提出了一种鲁棒变分贝叶斯推断方法TRACER,旨在解决离线强化学习中的数据损坏问题,显著提升智能体的鲁棒性。相关论文发表于NeurIPS 2024。
中科大王杰教授团队提出了一种鲁棒变分贝叶斯推断方法TRACER,旨在解决离线强化学习中的数据损坏问题,显著提升智能体的鲁棒性。相关论文发表于NeurIPS 2024。