本研究提出了一种新颖的决策点识别方法(NBDI),有效解决了在固定长度技能使用中漏掉重要决策点的问题,提升了代理的探索和政策学习能力。研究结果表明,NBDI在复杂任务中表现优异,突显了决策点识别在技能学习中的重要性。
完成下面两步后,将自动完成登录并继续当前操作。