本研究提出了一种新方法,通过时间跳跃连接和增强历史观察,解决实时强化学习中的延迟问题。实验结果表明,该方法在多种环境下显著提升了算法性能,推理速度提高了6-350%。
完成下面两步后,将自动完成登录并继续当前操作。