小红花·文摘

本研究提出了一种风险约束的强化学习框架RiskRL，旨在解决机器人导航中的定位频率选择问题。实验结果表明，RiskRL的性能优于基线方法至少13%，且具备适应新环境的能力。