小红花·文摘

本研究提出了一种基于课程学习的变换器强化学习算法CTSAC，旨在提升机器人探索中的环境推理能力和收敛速度。实验结果表明，CTSAC在成功率和探索效率方面优于现有算法。