研究人员介绍了一个新的模拟基准测试COLOSSEUM,用于评估机器人策略对环境变化的适应能力。他们比较了4种操作模型,在环境扰动下的成功率下降了30-50%,同时应用多个扰动时,成功率下降≥75%。改变干扰对象的数量、目标对象的颜色或照明条件是最大程度降低模型性能的扰动因素。研究人员证明了模拟结果与真实实验中的类似扰动相关。他们公开了COLOSSEUM的使用代码,并发布了用于复制真实世界扰动的三维打印对象的代码。希望COLOSSEUM能成为评估操作泛化能力的基准。
完成下面两步后,将自动完成登录并继续当前操作。