本研究提出了一种基于课程学习的变换器强化学习算法CTSAC,旨在提升机器人探索中的环境推理能力和收敛速度。实验结果表明,CTSAC在成功率和探索效率方面优于现有算法。
完成下面两步后,将自动完成登录并继续当前操作。