本文提出了一种集合建筑热力学模型,通过分层强化学习提高HVAC控制效率。该方法利用基础模型为特定建筑服务,动态选择和加权模型,实验结果表明其能提高预测准确性并减少开发工作量。
本研究提出了一种基于分层强化学习的双向任务-动作规划方法,旨在解决群体机器人在动态环境中的决策问题。实验结果显示,该方法在对抗中的胜率超过80%,决策时间低于0.01秒,展现出良好的应用潜力。
本文探讨了在多领域对话管理中应用分层强化学习和选项框架的方法,提升学习速度和结果。研究表明,强化学习在对话系统中的优化潜力,尤其是大型语言模型与人类反馈强化学习的结合,推动了对话生成和交互能力的提升。新方法有效解决了多轮对话中的规划问题,显著提高了学习效率和性能。
本文探讨了在战争推演中利用人工智能和机器学习提升决策质量的重要性,重点开发分层强化学习框架,以创建在复杂战斗模拟中表现出超人类能力的智能代理。研究领域包括HRL训练框架、代理决策的多模型框架及状态空间观察抽象化,以应对计算增长带来的挑战。
该文介绍了决策Transformer算法在强化学习中的应用,通过分层强化学习实现顺序决策,并发展了新的离线强化学习算法。实证结果表明该算法优于DT,可推动转换器架构在强化学习领域的整合。
该文介绍了使用分层强化学习(HRL)预测时间序列的任务。作者结合深度学习和分层强化学习的方法,开发了一个股票智能体和一个车辆智能体,结果表明这种HRL方法在训练速度、稳定性和预测准确性方面都有显著的改进。
完成下面两步后,将自动完成登录并继续当前操作。