本研究采用YOLOv7物体检测模型,针对厨房刀具使用中的不安全行为进行检测,成功识别手指位置和刀刃接触手的情况,显示出提升厨房安全的潜力。
本研究提出了一种新方法——受限信任区域策略优化(C-TRPO),旨在解决强化学习中的不安全行为问题。C-TRPO通过调整策略空间的几何结构,确保训练过程中的约束得到满足。实验结果表明,该方法在减少约束违规的同时,能够有效最大化奖励。
最近的研究发现,大型语言模型(LLMs)在机器人任务中可能产生歧视性结果和不安全行为。研究人员对几个高评级的LLMs进行了歧视和安全评估,发现它们在面对多样性身份特征的人时会产生偏见输出,并且在自由语言输入环境中不能安全行动。需要对LLMs进行风险评估和保证,以确保机器人的安全和公正运行。
完成下面两步后,将自动完成登录并继续当前操作。