本研究提出了一种优化抽样数据集(OSDs)的方法,显著提高了神经网络在模型预测控制(MPC)中的训练效果。在1型糖尿病的自动胰岛素输送中,该方法实现了四倍的精确度提升,并获得了临床测试的监管许可,为复杂算法在资源受限平台上的应用提供了新思路。
本研究提出了一种结合模型预测控制器和车载大语言模型的混合架构,以提升自主驾驶系统在复杂驾驶场景中的决策和人机交互能力,显著提高了推理准确性和控制适应性,支持实时部署。
本研究将无人机送货问题视为控制问题,采用模型预测控制(MPC)方法进行求解。结果表明,MPC在复杂环境中能更快解决问题,所需无人机数量较少,有效实现成本最小化和路径优化。
随着广告业务复杂性增加,MaRCA(基于多智能体强化学习的全链路算力调度)应运而生。该系统通过预估用户价值、算力和动作价值,优化算力分配,提升广告消费和系统稳定性。实验显示,在资源不变的情况下,MaRCA实现了14.93%的广告消费增长,未来将引入模型预测控制和扩展决策变量,以应对复杂流量环境。
本文提出了一种新颖的自引导模型预测控制算法(BMPC),有效解决了无模型学习策略和价值估计不准确的问题。BMPC通过模仿专家和结合时序差分学习,显著提升了控制效率和数据效率,尤其在高维运动任务中表现突出。
本研究提出了一种扩散信息模型预测控制框架(D-I MPC),旨在解决部分可观测随机系统中的不确定性预测与决策问题。实验结果表明,该框架在电池能量存储系统的能量套利任务中优于传统方法。
本文研究了模型预测控制(MPC)与强化学习(RL)的关系,探讨其在马尔可夫决策过程中的应用与优势。提出了一种基于演员-评论家方法的分类框架,并展示了如何利用MPC的在线优化提升政策性能。
本研究提出了一种新方法,将模型预测控制(MPC)应用于大型语言模型的提示技术,从而显著提升其规划能力和决策质量。
本研究提出了一种学习基础的模型预测控制(LBMPC)方案,旨在提高系统性能并确保安全性。通过统计识别工具和模糊模型,LBMPC在优化框架中实现安全与性能的分离。研究还探讨了结合机器学习的自适应MPC系统及高斯过程与MPC的结合,展示了在复杂系统中的有效性和适应性,具有广泛的应用潜力。
本研究提出了一种核插值方法,用于高效安全地逼近模型预测控制。通过评分函数选择数据,限制在闭环可达状态集合内,降低计算复杂度。结果表明,该方法在初始条件较少的系统中表现出色,确保控制器的安全性和高性能。
本研究结合模型预测控制和安全贝叶斯优化,提出新方法解决模型不确定性和成本函数设计问题。在模型与实际不匹配的情况下优化锂电池充电时间,确保安全性和系统稳定性。
本文探讨了模型预测控制(MPC)与强化学习结合的方法,以提高机器人在复杂任务中的控制效率。研究表明,结合规划与强化学习能显著提升任务执行效果,并通过优化算法实现更好的样本效率。提出的TD-MPC和PTP方法有效应对机器人训练中的挑战,展示了基于模型的控制在多任务场景中的优势。
本研究提出了一种学习基础的模型预测控制(LBMPC)方案,旨在提高系统性能并确保安全性。LBMPC通过统计识别工具和维护两个模型,在优化框架中实现安全与性能的分离。同时,研究探讨了基于神经网络的控制器设计,强调在未知系统模型下的闭环稳定性和控制性能。
本文综述了强化学习在连续控制中的应用,特别是模型预测控制(MPC)与强化学习的结合。研究提出了多目标强化学习框架和基于信息理论的Q学习算法,验证了其在实际控制任务中的有效性,并提出了新的参数化控制器,以提高计算效率和性能保证,展示了在实际场景中的应用潜力。
本文探讨了模型预测控制与强化学习的结合,提出了多种算法(如PPO和DMPO)在四旋翼飞行器控制中的应用。研究表明,基于模型的方法在样本复杂度上优于无模型方法,且DMPO在性能和内存使用上表现出色。此外,新型参数化控制器在解释性和性能上优于传统控制器,展示了实际应用的潜力。
该研究探讨了深度强化学习在流体动力学和无人机控制中的应用,结合模型预测控制和神经网络,提出多种优化策略,显著提高样本效率和控制精度,尤其在动态环境下表现优异。这些方法有助于提升风力涡轮的能量生成效率,减少噪音污染,推动可持续能源发展。
波士顿动力的工程师分享了人形机器人Atlas的研发历程和经验教训,使用模型预测控制(MPC)实现高难度动作,计划将MPC与机器学习结合以提升性能。
本文探讨了控制微分方程的签名函数及其在机器学习中的应用,介绍了基于粗路径理论的签名方法,强调了其在时间序列分析中的有效性。研究提出了一种签名控制框架,能够高效处理动态系统,并设计了适用于路径跟踪的模型预测控制方法。实证研究验证了签名与其他算法结合的优势。
本文探讨了工业过程优化与控制的重要性,提出了结合人工神经网络、模型预测控制和深度学习的数字孪生框架,以提高经济和生态效益,并解决数据主权和专业知识问题。通过模拟和优化,增强了增材制造和食品加工等领域的过程控制与决策能力。
本文提出了一种基于Koopman算子的线性预测器,旨在控制非线性动力系统。该方法为数据驱动,适用于模型预测控制(MPC),能够有效学习非线性系统的稳定模型,并在电网等领域实现实时控制,展现出良好的性能和鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。