利用贝叶斯强化学习辅助导航以避免盲点中的人群

📝

内容提要

本研究介绍了一种新的算法 BNBRL+,基于部分可观测的马尔科夫决策过程框架评估不可见区域的风险,并在不确定性下制定移动策略,通过将信念算法与贝叶斯神经网络相结合,根据人类的定位数据以概率推断信念,进一步整合机器人、人类和推断信念之间的动力学,确定导航路径并将社交规范嵌入奖励函数中,从而促进了社会感知导航。通过在各种风险环境中进行实验,验证了 BNBRL +...

➡️

继续阅读