小红花·文摘

本文提出了一种针对非线性机器人系统的闭环控制方案，利用增量马尔可夫决策过程（iMDP）算法优化控制策略，降低跟踪偏差。同时，研究探讨了基于最大熵的强化学习方法和新的随机优化算法，强调了其在非凸环境中的收敛性及在机器人应用中的有效性。

BriefGPT - AI 论文速递 ·

本文介绍了一种结合凸优化和松弛优化技术的在线非随机控制理论，提出了基于OGD-BZ算法的在线最优控制解决方案，并分析了策略遗憾问题。研究还探讨了非线性机器人系统的闭环控制、算法的收敛性与鲁棒性，以及在线两阶段随机优化问题，旨在提升控制系统的性能与效率。

BriefGPT - AI 论文速递 ·