本研究提出了一种优化抽样数据集(OSDs)的方法,显著提高了神经网络在模型预测控制(MPC)中的训练效果。在1型糖尿病的自动胰岛素输送中,该方法实现了四倍的精确度提升,并获得了临床测试的监管许可,为复杂算法在资源受限平台上的应用提供了新思路。
本研究提出了一种结合模型预测控制器和车载大语言模型的混合架构,以提升自主驾驶系统在复杂驾驶场景中的决策和人机交互能力,显著提高了推理准确性和控制适应性,支持实时部署。
本研究将无人机送货问题视为控制问题,采用模型预测控制(MPC)方法进行求解。结果表明,MPC在复杂环境中能更快解决问题,所需无人机数量较少,有效实现成本最小化和路径优化。
随着广告业务复杂性增加,MaRCA(基于多智能体强化学习的全链路算力调度)应运而生。该系统通过预估用户价值、算力和动作价值,优化算力分配,提升广告消费和系统稳定性。实验显示,在资源不变的情况下,MaRCA实现了14.93%的广告消费增长,未来将引入模型预测控制和扩展决策变量,以应对复杂流量环境。
本文提出了一种新颖的自引导模型预测控制算法(BMPC),有效解决了无模型学习策略和价值估计不准确的问题。BMPC通过模仿专家和结合时序差分学习,显著提升了控制效率和数据效率,尤其在高维运动任务中表现突出。
本研究提出了一种扩散信息模型预测控制框架(D-I MPC),旨在解决部分可观测随机系统中的不确定性预测与决策问题。实验结果表明,该框架在电池能量存储系统的能量套利任务中优于传统方法。
本文研究了模型预测控制(MPC)与强化学习(RL)的关系,探讨其在马尔可夫决策过程中的应用与优势。提出了一种基于演员-评论家方法的分类框架,并展示了如何利用MPC的在线优化提升政策性能。
本研究提出了一种新方法,将模型预测控制(MPC)应用于大型语言模型的提示技术,从而显著提升其规划能力和决策质量。
高斯过程学习模型预测控制(GP-MPC)结合高斯过程与模型预测控制,提升复杂系统的控制效果。文章详细介绍了GP-MPC的数学形式及其在机器人控制中的应用,展示了其有效性与适应性,旨在为研究者提供深入的理论与实践理解。
本研究提出了一种核插值方法,用于高效安全地逼近模型预测控制。通过评分函数选择数据,限制在闭环可达状态集合内,降低计算复杂度。结果表明,该方法在初始条件较少的系统中表现出色,确保控制器的安全性和高性能。
本研究结合模型预测控制和安全贝叶斯优化,提出新方法解决模型不确定性和成本函数设计问题。在模型与实际不匹配的情况下优化锂电池充电时间,确保安全性和系统稳定性。
研究发现,经过优化的基于数据策略在高自由度控制任务中表现优异。在多任务场景中,结合动态模型的模型预测控制能提高性能和数据效率。此外,基于模型的规划器可以简化为策略,减少计算负担。
波士顿动力的工程师分享了人形机器人Atlas的研发历程和经验教训,使用模型预测控制(MPC)实现高难度动作,计划将MPC与机器学习结合以提升性能。
本研究通过学习密度分布计算无人系统前向可达状态的数据驱动方法,结合模型预测控制,应对系统不确定性进行可验证的安全路径规划。在自动驾驶和气垫船控制方面的实验中,证明了该方法在处理不确定性和复杂动态系统中的优异性能。
H-GAP是一种基于人型轨迹数据训练得到的通用自编码规划器,能够通过模型预测控制(MPC)处理下游控制任务。H-GAP在任务处理和性能方面表现出色,超过了具备地面实况模型的MPC基准线,并且与离线强化学习方法相当或优越。
本文介绍了一种全学习的层次化框架,可以同时学习低层控制器和高层潜在动作空间,并对多个机器人的运动进行泛化。通过模型预测控制方法计划连续潜在动作,成功实现了多个任务和两个模拟器上的优越表现。在六足机器人实验上,表现出了稳健性和样本效率。
本研究介绍了一种学习基础的模型预测控制方案,提高系统性能并提供稳健性的确定性保证。该方案利用统计识别工具识别系统的更丰富模型,通过维护两个模型,在一个优化框架中将安全性和性能隔离。LBMPC通过选择最小化成本的输入来提高性能,并通过检查模糊模型稳定性来确保安全性和鲁棒性。此外,证明了LBMPC控制行动以概率收敛为使用真实动力学计算的MPC的行动。
通过引入跳跃连接和改进ODE的某些项,改进的PINC在油井应用中表现出卓越性能,验证预测误差平均降低了67%,增强了网络层之间的梯度流动。改进的PINC模型在存在噪声测量的情况下,通过模型预测控制(MPC)有效地调节油井底孔压力。
本研究发现使用修正线性单元作为激活函数的人工神经网络可以准确表示线性时不变系统的模型预测控制的分段仿射函数。使用更深的网络可以表示更多的仿射区域。研究提出了决定神经网络最小隐藏层数和每层神经元数的理论界限。该方法有潜力成为预测控制规律的近似方法,可以提高近似质量并减少内存需求。还提出了校正或量化近似误差的替代方案。可以在低功耗嵌入式设备上部署近似控制器,实现复杂物理系统的先进决策制定策略。
本文提出了一种集成模型预测安全认证的新算法,结合了基于模型的深度强化学习和基于管道的模型预测控制,通过修正学习代理的行动来最小化安全约束违规。与其他强化学习方法相比,该算法能显著减少约束违规。
完成下面两步后,将自动完成登录并继续当前操作。