小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。

IDEA-Research推出的一系列检测、分割模型:从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法 算法之道
结构之法 算法之道 · 2025-08-07T05:59:08Z

本研究提出MGD-SAM2模型,旨在提高高分辨率无类别分割的细粒度细节分割精度。通过整合多视角特征,模型显著增强了局部细节和全局语义的提取能力,实验结果表明其在多个数据集上表现优异。

MGD-SAM2: A Second-Generation Universal Segmentation Model with Multi-View Guided Detail Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了改进版SAM2模型,旨在提升图像和视频分割模型在跨领域适应性和泛化能力方面的表现。尽管特定领域适应性仍需进一步研究,但其在医疗成像等专业领域的应用潜力巨大。

SAM2在图像和视频分割中的应用:一项全面的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

AIxiv报道了字节跳动与北大等机构联合提出的多模态大模型Sa2VA,该模型结合了SAM-2和LLaVA的优势,实现了视频和图像的细粒度理解,支持多种任务,表现优异。

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

机器之心
机器之心 · 2025-02-12T05:22:57Z
Kdenlive 推出背景去除工具等功能,为2025 年做好准备

Kdenlive 是一款流行的开源视频编辑器,计划在 2025 年推出背景移除工具,目前已进入 alpha 测试阶段。该工具基于 SAM2 对象分割,支持 Linux 和 Windows 平台。

Kdenlive 推出背景去除工具等功能,为2025 年做好准备

实时互动网
实时互动网 · 2024-12-30T02:36:48Z

本研究提出了一种新的干扰物感知记忆模型SAM2.1++,旨在提高视觉物体跟踪的分割精度和稳定性。实验结果表明,该模型在七个基准测试中优于现有方法,并在六个测试中创下新纪录。

A Distractor-Aware Memory Model for Visual Object Tracking (SAM2)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究探讨了Segment Anything Model 2(SAM2)在视频伪装目标分割(VCOS)中的应用和性能,解决了伪装物体难以检测的难题。研究中评估了SAM2在不同数据集上的表现,并通过与现有多模态大语言模型的整合及特定的数据集微调,发现SAM2在视频中的伪装物体检测中具备出色的零样本能力,这一能力可以通过调整参数进一步提升。

当SAM2遇上视频伪装目标分割:全面评估与适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-27T00:00:00Z

本研究针对现有医学图像分割模型在少量标注数据下表现不佳的问题,提出了一种新的方法FS-MedSAM2。通过充分利用SAM2的训练记忆注意模块和处理掩码提示的能力,该方法在两个公开医学图像数据集上超越了当前的最先进技术,展示了其显著的应用潜力。

FS-MedSAM2:探索SAM2在无微调情况下的少量医学图像分割潜力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-06T00:00:00Z

本文评估了Segment Anything Model 2(SAM2)在类别无关实例级分割任务中的表现,并填补了现有研究中的评测空白。研究发现SAM2在不同场景中的性能差异,以及对高分辨率结构分割的局限性。建议利用SAM2适配器提升大规模视觉模型在该领域的性能上限。

针对类别无关实例级分割的SAM 2评估研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

Meta发布了升级版的计算机视觉模型Segment Anything Model 2 (SAM 2),可以实时快速识别和分离图像或视频中的对象。文章提供了使用Modelbit将SAM 2模型部署为REST API的说明。SAM 2具有多个关键功能和增强,包括内存机制、流式架构、增强图像分割、多个掩码预测、遮挡预测和视频分割。文章还解释了如何以编程方式使用SAM 2为图像生成分割掩码。最后,讨论了如何使用Modelbit将SAM 2模型部署为REST API端点。

如何使用Modelbit部署Segment Anything Model 2 (SAM 2)

DEV Community
DEV Community · 2024-08-29T22:54:32Z

本研究通过使用通用的提示式分割算法SAM 2适应于3D医学图像注释,并通过3D Slicer软件提供了实现,解决了3D医学数据注释耗时且需要专业技术的难题。该扩展可提高医学图像的注释效率,具有重要的应用潜力。

SAM SAM 2 在 3D Slicer 中:用于医学图像注释的 SegmentWithSAM 扩展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

Meta公司发布了SAM 2,可以实时分割静态图像和动态视频内容。牛津大学团队开发了MedSAM-2,基于SAM 2的医学图像分割模型,具有出色的性能和泛化能力。SAM在医学图像分割领域具有潜力,其他团队也在探索其应用。

SAM 2最新应用落地!牛津大学团队发布Medical SAM 2,刷新医学图像分割SOTA榜

HyperAI超神经
HyperAI超神经 · 2024-08-26T06:50:40Z

Meta发布了Segment Anything Model 2 (SAM 2),可以实时对图像和视频中的对象进行分割和跟踪。SAM 2已应用于医学成像和自动驾驶等多个领域。Meta还发布了一个名为SA-V的大规模数据集,用于训练SAM 2。该数据集包含50.9K个视频和642.6K个掩膜,为未来的计算机视觉研究提供了丰富的资源。SA-V数据集可以从HyperAI网站下载。

一键下载Meta最大视频分割数据集!含50.9K真实世界视频,覆盖47个国家

HyperAI超神经
HyperAI超神经 · 2024-08-25T06:51:15Z

本研究探讨了现有的分割基础模型在处理生物医学图像和视频方面的应用,尤其聚焦于SAM2模型的适用性和局限性。通过适应和微调,研究指出SAM2在不同数据集和任务中的表现存在差异,但在减少注释负担和实现零-shot分割方面展现出潜力。该工作强调了填补自然与医学图像领域差距的重要性,促进了临床应用的发展。

释放SAM2在生物医学图像和视频中的潜力:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-23T00:00:00Z

本研究解决了图像分割领域中强编码器缺乏的问题,提出了一个名为SAM2-UNet的框架,将Segment Anything Model 2作为编码器,与经典的U型解码器结合。实验结果表明,SAM2-UNet在多个下游任务中表现出优越性,超越了现有的专业最先进方法,具有广泛的应用潜力。

SAM2-UNet:Segment Anything 2为自然和医学图像分割提供强大的编码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-16T00:00:00Z
LWiAI 播客第177集 - Instagram AI 机器人,Noam Shazeer 重返 Google,FLUX.1,SAM2

本期节目主要讨论了AI领域的重大更新和讨论,包括Instagram的新AI功能、Waymo在旧金山推出无人驾驶汽车以及NVIDIA的芯片延迟等。还涉及到Meta的AI Studio、character.ai首席执行官Noam Shazir重返Google以及Google的Gemini更新等话题。此外,还讨论了NVIDIA的硬件问题、人形机器人的进展以及像Open Devon这样的新开源AI工具。政策讨论涉及到欧盟的AI法案、美国对开源AI的立场以及对Google和Anthropic的调查。还强调了通过深度伪造技术传播的虚假信息的影响,特别是涉及到埃隆·马斯克的一个案例,强调了重要的行业影响和监管影响。

LWiAI 播客第177集 - Instagram AI 机器人,Noam Shazeer 重返 Google,FLUX.1,SAM2

Last Week in AI
Last Week in AI · 2024-08-11T20:16:41Z

研究团队提出了Segment Anything Model 2(SAM 2),是一个用于图像和视频分割的基础模型。SAM 2是一个简单的Transformer架构,具有流式存储器,用于实时视频处理。在广泛的任务中,SAM 2表现出强大的性能,视频分割中使用3倍少的交互获得更好的准确性,图像分割中比SAM模型更准确且速度快6倍。研究团队将发布模型版本、数据集和交互式演示。

SAM2-适配器:在下游任务(伪装、阴影、医学图像分割等)中评估与适配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

研究比较了Segment Anything Model (SAM)和Segment Anything Model 2 (SAM 2)在医学图像分割方面的性能。结果显示,虽然SAM 2在某些情况下稍好,但总体而言,SAM 2并没有超过SAM。

SAM 2在医学图像分割中的表现是否优于SAM?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

Segment Anything Model (SAM)推动了生物医学影像分析领域的进展。研究发现,SAM在解决临床挑战方面仍有改进空间,特别是对于颈动脉、肾上腺、视神经和下颌骨的分割。调查深入研究了SAM的创新技术和在医学影像场景中的应用。

SAM2-PATH:一种更好的数字病理学语义分割模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

研究团队提出了Segment Anything Model 2(SAM 2),是一个解决图像和视频中可提示的视觉分割的基础模型。SAM 2是一个简单的Transformer架构,具有流式存储器,用于实时视频处理。在广泛的任务中,SAM 2表现出强大的性能,比之前的方法使用更少的交互获得更好的准确性。研究团队相信他们的数据、模型和见解将成为视频分割和相关感知任务的重要里程碑。他们将发布模型的一个版本、数据集和一个交互式演示。

评估 Segmentation Anything Model 2:SAM2 在水下环境中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码