小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在线教程丨英伟达开源LocateAnything,3B模型可实现图像+视频的目标指向/开放词汇目标检测/指代表达定位/OCR文本定位等功能

NVIDIA 最近推出了视觉语言定位模型LocateAnything-3B,拥有30亿参数,支持多种视觉定位任务。其核心创新为并行框解码(PBD),显著提升了定位精度和解码速度,尤其在复杂场景下表现优异,推动了视觉定位技术的发展。

在线教程丨英伟达开源LocateAnything,3B模型可实现图像+视频的目标指向/开放词汇目标检测/指代表达定位/OCR文本定位等功能

HyperAI超神经
HyperAI超神经 · 2026-06-02T09:55:40Z
Python 潮流周刊#152:编程智能体终于跨过质量门槛了?

本期Python潮流周刊分享了10篇文章和12个开源项目,涵盖批量API调用、Python容器压缩、实时目标检测和推荐系统优化等主题。同时介绍了AI智能体安全测试平台和磁盘清理工具,旨在帮助读者提升Python技术和职业发展。

Python 潮流周刊#152:编程智能体终于跨过质量门槛了?

豌豆花下猫 | Python猫
豌豆花下猫 | Python猫 · 2026-05-30T00:00:00Z
音视频 AI 模型进阶与实践指南

本文介绍音视频AI模型的进阶与实践,适合初级开发者。推荐使用YAMNet进行音频分类和Silero VAD进行语音活动检测,视频领域则推荐YOLO模型用于目标检测。强调迁移学习和模型微调的重要性,并提供智能录音、视频剪辑工具和AR滤镜检测等实战项目建议。初学者应关注性能优化,确保流畅体验,扎实音视频基础与AI结合。

音视频 AI 模型进阶与实践指南

实时互动网
实时互动网 · 2026-05-26T03:11:16Z
GeCo2:基于渐进式查询聚合的通用尺度目标计数模型部署实践

该文章介绍了一个基于Tkinter的图像计数检测应用GECO2。用户可以加载图片、绘制示例框,并通过深度学习模型进行目标检测。该应用支持图像预处理、模型推理和结果显示,能够实时反馈检测到的目标数量。

GeCo2:基于渐进式查询聚合的通用尺度目标计数模型部署实践

dotNET跨平台
dotNET跨平台 · 2026-05-26T00:00:00Z
无需联网!基于 .NET + YOLO 的桌面端图像与视频目标检测实战

本文介绍了一款基于.NET开发的轻量级桌面应用,利用YOLO模型实现本地目标检测。该工具支持图片和视频的实时分析,界面简洁,操作简单,适合非技术人员使用。所有处理在本地完成,保障数据隐私,并支持GPU加速,适用于工业检测和安防监控等场景。

无需联网!基于 .NET + YOLO 的桌面端图像与视频目标检测实战

dotNET跨平台
dotNET跨平台 · 2026-04-15T00:02:54Z
.NET 8 + WPF 写的 YOLO 标注神器:ONNX 推理 + GPU 加速,标注效率翻倍

这是一款高效的AI图片标注工具,专为YOLO目标检测模型设计,提升数据准备的效率与准确性。支持YOLO格式标注、AI自动推理和批量管理,适合个人研究和小型团队,简化传统标注流程。

.NET 8 + WPF 写的 YOLO 标注神器:ONNX 推理 + GPU 加速,标注效率翻倍

dotNET跨平台
dotNET跨平台 · 2026-03-01T00:01:28Z
从零部署 YOLO26:OpenVINO™ C# API 项目实战(附完整代码)

本文是一个实战教程,介绍如何使用OpenVINO™ C# API 3.2实现YOLO26目标检测项目,内容包括环境搭建、模型部署、推理和优化,适合C#开发者和计算机视觉工程师。通过六个演示,您将掌握模型部署流程和性能优化技巧。

从零部署 YOLO26:OpenVINO™ C# API 项目实战(附完整代码)

dotNET跨平台
dotNET跨平台 · 2026-02-28T00:02:18Z

YoloSharp 是一个轻量级的目标检测库,专为 .NET 平台设计,支持主流 YOLO 模型,简化了 C# 开发者的使用流程,提供高效的图像处理和检测功能,支持 CPU 和 GPU 推理,易于集成,降低了深度学习模型的使用门槛。

.NET 10 也能跑 YOLO?用 YoloSharp 轻松实现目标检测

dotNET跨平台
dotNET跨平台 · 2026-01-20T23:55:37Z
YOLOv5 目标检测笔记

YOLOv5 的主干网络采用改进版 CSPDarknet,通过下采样提取特征,包含 Focus、CBS 和核心组件 C3 模块,优化了梯度传导。Neck 部分融合特征,使用 FPN 和 PAN 结构,最后 Head 模块根据不同特征图输出检测结果。

YOLOv5 目标检测笔记

plus studio
plus studio · 2026-01-01T00:00:00Z
【案例共创】基于华为开发者空间的RestNet50目标检测

本案例介绍了基于ResNet50模型的皮肤肿瘤分类,用户通过华为开发者空间的AI Notebook学习模型训练、部署及API集成,提升实用技能。该模型在验证集上表现优异,有助于医学早期诊断和提高诊断效率。

【案例共创】基于华为开发者空间的RestNet50目标检测

华为云官方博客
华为云官方博客 · 2025-12-18T14:00:00Z
何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

抱歉,文本内容过于简短,无法有效总结。请提供更详细的文章内容。

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

机器之心
机器之心 · 2025-12-11T10:20:27Z
AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

上海人工智能实验室开发的P1系列开源物理推理模型在物理学研究中取得显著进展,特别是在国际奥林匹克物理竞赛中表现突出,P1-235B-A22B模型有望在2025年竞赛中获得金牌。

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z
在线教程丨目标检测迈入「全局感知」时代:清华大学等发布 YOLOv13,实现速度、精度双突破

YOLOv13是清华大学等高校研发的新目标检测模型,解决了YOLO系列在复杂场景下的性能瓶颈。通过引入HyperACE机制,YOLOv13有效建模高阶相关性,提升视觉感知能力。与前代相比,YOLOv13在MS COCO上显著提升性能,同时降低参数和计算开销。

在线教程丨目标检测迈入「全局感知」时代:清华大学等发布 YOLOv13,实现速度、精度双突破

HyperAI超神经
HyperAI超神经 · 2025-11-18T05:26:18Z
实时目标检测SOTA!YOLOv13拓展全局感知能力;入选NeurIPS 2025,UltraHR-100K解锁超高分辨率文生图

YOLOv13是最新的目标检测模型,采用超图自适应相关性增强机制,提升了全局特征融合能力,克服了以往模型的局限性。该模型在MS COCO和Pascal VOC数据集上表现优异,展现出更强的泛化能力和实用性。

实时目标检测SOTA!YOLOv13拓展全局感知能力;入选NeurIPS 2025,UltraHR-100K解锁超高分辨率文生图

HyperAI超神经
HyperAI超神经 · 2025-11-10T06:08:17Z
AI 论文周报丨OCR 新模型/多模态大语言模型/下一代 DNA 测序……一文了解多领域最新进展

IDEA研究中心推出了3B规模的多模态大语言模型Rex-Omni,显著提升了目标检测性能,超越了传统模型。在COCO和LVIS基准测试中表现优异,具备多样化的视觉理解能力,为更通用的视觉感知系统奠定基础。

AI 论文周报丨OCR 新模型/多模态大语言模型/下一代 DNA 测序……一文了解多领域最新进展

HyperAI超神经
HyperAI超神经 · 2025-10-27T08:05:07Z

人工智能与遥感技术的结合使遥感目标检测成为计算机视觉的重要研究方向,能够在复杂环境中识别滑坡和农作物,提供实时地球观测。构建高质量数据集是关键,推动了目标检测的实用化。HyperAI整理了多个领域的数据集,促进技术应用。

遥感目标检测数据集汇总,覆盖城市问题/工业安全/农业健康/室内场景……

HyperAI超神经
HyperAI超神经 · 2025-09-29T06:54:44Z

YOLO系列算法在目标检测中表现出色,YOLOv8的发布进一步提升了性能。基于WinForm的项目实现了YOLOv8模型的高效部署,支持多种推理后端,用户可通过图形界面轻松操作,满足实时检测需求,增强了模型的实用性和可用性。

C# 部署 Yolov8 全攻略:OpenVINO 与 TensorRT 双引擎加速

dotNET跨平台
dotNET跨平台 · 2025-08-26T23:54:38Z

本文介绍了一个基于ONNX的目标检测模型,使用C#和OpenCV进行图像处理。模型接受640x640的图像输入,输出物体位置和置信度。用户可选择图像进行推理,结果将在界面上显示。

C# OnnxRuntime Yolov8 纸箱检测

dotNET跨平台
dotNET跨平台 · 2025-08-10T00:01:37Z

本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。

IDEA-Research推出的一系列检测、分割模型:从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法 算法之道
结构之法 算法之道 · 2025-08-07T05:59:08Z

LOVON系统结合大语言模型与开放词汇视觉感知,旨在提升足式机器人在复杂环境中的长时任务执行能力。通过拉普拉斯方差滤波技术,LOVON解决了视觉不稳定性,实现了动态目标下的自主导航与任务规划。

LOVON——面向足式Open-Vocabulary的物体导航:LLM做任务分解、YOLO11做目标检测,最后L2MM将指令和视觉映射为动作(且解决动态模糊)

结构之法 算法之道
结构之法 算法之道 · 2025-08-01T08:32:19Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码