小红花·文摘

本研究提出了一种新颖的强化学习算法——软分析策略优化（SAPO），旨在解决软体物体仿真中的数据质量和样本复杂度问题，并开发了并行平台Rewarped，以提升强化学习在刚体和可变形体任务中的应用效果。