用于长期软体机器人数据收集的模块化并行操控器

本研究针对软体机器人领域长期实验和大规模数据收集面临的硬件耐用性和实验灵活性问题，提出了一种模块化并行机器人操控平台。该平台支持多种软体机器人制造方法，具有设计灵活性，可以进行不同几何形状和材料特性的实验，验证了其在基准2D操控任务中直接用于策略梯度强化学习的能力。

该文章评估了可微分物理实验基准PasticineLab上强化学习和梯度优化方法的表现。结果显示，基于梯度的方法在短期内能快速找到解决方案，但在长期规划的多阶段任务上表现不佳。该基准有望促进结合可微分物理和强化学习的新算法的开发。

PasticineLab 可微分物理实验基准多阶段任务并行强化学习机器人梯度优化方法模块化