小红花·文摘

本研究采用YOLOv7物体检测模型，针对厨房刀具使用中的不安全行为进行检测，成功识别手指位置和刀刃接触手的情况，显示出提升厨房安全的潜力。

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法——受限信任区域策略优化（C-TRPO），旨在解决强化学习中的不安全行为问题。C-TRPO通过调整策略空间的几何结构，确保训练过程中的约束得到满足。实验结果表明，该方法在减少约束违规的同时，能够有效最大化奖励。

BriefGPT - AI 论文速递 ·