小红花·文摘 - 小红花技术领袖俱乐部

Perception-R1是由多所高校联合开发的多模态大语言模型，首次在COCO2017验证集上实现30AP，超越YOLOv3等模型。该模型通过强化学习优化视觉感知策略，提升了物体检测、计数和OCR等任务的能力，为AI视觉感知的未来奠定基础。

用多模态LLM超越YOLOv3！强化学习突破多模态感知极限｜开源

量子位 ·

YOLOv3是一种高效的目标检测算法，能够快速准确地检测对象。它使用一次性检测方法，同时完成对象分类和边界框回归。采用Darknet-53作为主干网络，使用特征金字塔网络实现多尺度检测，预测对象位置时使用预定义的锚框。适合实时视频流处理，广泛应用于工业界和学术界。

免费领取云主机，在华为开发者空间玩转YOLOV3

华为云官方博客 ·

本案例将在ModelBox中使用YOLO v3模型，实现一个简单的口罩检测应用

ModelBox开发体验：使用YOLOv3做口罩检测

华为云官方博客 ·