小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。

IDEA-Research推出的一系列检测、分割模型:从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法 算法之道
结构之法 算法之道 · 2025-08-07T05:59:08Z

本研究提出MGD-SAM2模型,旨在提高高分辨率无类别分割的细粒度细节分割精度。通过整合多视角特征,模型显著增强了局部细节和全局语义的提取能力,实验结果表明其在多个数据集上表现优异。

MGD-SAM2: A Second-Generation Universal Segmentation Model with Multi-View Guided Detail Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了改进版SAM2模型,旨在提升图像和视频分割模型在跨领域适应性和泛化能力方面的表现。尽管特定领域适应性仍需进一步研究,但其在医疗成像等专业领域的应用潜力巨大。

SAM2在图像和视频分割中的应用:一项全面的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

AIxiv报道了字节跳动与北大等机构联合提出的多模态大模型Sa2VA,该模型结合了SAM-2和LLaVA的优势,实现了视频和图像的细粒度理解,支持多种任务,表现优异。

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

机器之心
机器之心 · 2025-02-12T05:22:57Z
Kdenlive 推出背景去除工具等功能,为2025 年做好准备

Kdenlive 是一款流行的开源视频编辑器,计划在 2025 年推出背景移除工具,目前已进入 alpha 测试阶段。该工具基于 SAM2 对象分割,支持 Linux 和 Windows 平台。

Kdenlive 推出背景去除工具等功能,为2025 年做好准备

实时互动网
实时互动网 · 2024-12-30T02:36:48Z

本研究提出了一种新的干扰物感知记忆模型SAM2.1++,旨在提高视觉物体跟踪的分割精度和稳定性。实验结果表明,该模型在七个基准测试中优于现有方法,并在六个测试中创下新纪录。

A Distractor-Aware Memory Model for Visual Object Tracking (SAM2)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究探讨了Segment Anything Model 2(SAM2)在视频伪装目标分割(VCOS)中的应用和性能,解决了伪装物体难以检测的难题。研究中评估了SAM2在不同数据集上的表现,并通过与现有多模态大语言模型的整合及特定的数据集微调,发现SAM2在视频中的伪装物体检测中具备出色的零样本能力,这一能力可以通过调整参数进一步提升。

当SAM2遇上视频伪装目标分割:全面评估与适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-27T00:00:00Z

本研究针对现有医学图像分割模型在少量标注数据下表现不佳的问题,提出了一种新的方法FS-MedSAM2。通过充分利用SAM2的训练记忆注意模块和处理掩码提示的能力,该方法在两个公开医学图像数据集上超越了当前的最先进技术,展示了其显著的应用潜力。

FS-MedSAM2:探索SAM2在无微调情况下的少量医学图像分割潜力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-06T00:00:00Z

该文介绍了Meta AI Research开发的Segment Anything Model(SAM)及其后续版本SAM 2。研究表明,SAM在图像和视频分割中表现优异,尤其在手术视频和高分辨率图像处理方面。SAM 2通过新的评估方法和用户交互数据引擎显著提高了分割准确性和效率,展示了其在计算机视觉领域的重要性和广泛应用潜力。

针对类别无关实例级分割的SAM 2评估研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

Meta发布了升级版的计算机视觉模型Segment Anything Model 2 (SAM 2),可以实时快速识别和分离图像或视频中的对象。文章提供了使用Modelbit将SAM 2模型部署为REST API的说明。SAM 2具有多个关键功能和增强,包括内存机制、流式架构、增强图像分割、多个掩码预测、遮挡预测和视频分割。文章还解释了如何以编程方式使用SAM 2为图像生成分割掩码。最后,讨论了如何使用Modelbit将SAM 2模型部署为REST API端点。

如何使用Modelbit部署Segment Anything Model 2 (SAM 2)

DEV Community
DEV Community · 2024-08-29T22:54:32Z

Meta公司发布了SAM 2,可以实时分割静态图像和动态视频内容。牛津大学团队开发了MedSAM-2,基于SAM 2的医学图像分割模型,具有出色的性能和泛化能力。SAM在医学图像分割领域具有潜力,其他团队也在探索其应用。

SAM 2最新应用落地!牛津大学团队发布Medical SAM 2,刷新医学图像分割SOTA榜

HyperAI超神经
HyperAI超神经 · 2024-08-26T06:50:40Z

Meta发布了Segment Anything Model 2 (SAM 2),可以实时对图像和视频中的对象进行分割和跟踪。SAM 2已应用于医学成像和自动驾驶等多个领域。Meta还发布了一个名为SA-V的大规模数据集,用于训练SAM 2。该数据集包含50.9K个视频和642.6K个掩膜,为未来的计算机视觉研究提供了丰富的资源。SA-V数据集可以从HyperAI网站下载。

一键下载Meta最大视频分割数据集!含50.9K真实世界视频,覆盖47个国家

HyperAI超神经
HyperAI超神经 · 2024-08-25T06:51:15Z

本研究探讨了现有的分割基础模型在处理生物医学图像和视频方面的应用,尤其聚焦于SAM2模型的适用性和局限性。通过适应和微调,研究指出SAM2在不同数据集和任务中的表现存在差异,但在减少注释负担和实现零-shot分割方面展现出潜力。该工作强调了填补自然与医学图像领域差距的重要性,促进了临床应用的发展。

释放SAM2在生物医学图像和视频中的潜力:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-23T00:00:00Z

该研究提出了多种视频目标分割模型,包括基于循环神经网络和Transformer架构的方法,表现优异。新模型OnlineRefer和SAM 2通过创新的学习策略和数据集,显著提高了目标分割的准确性和效率,尤其在真实场景中表现出色。

UNINEXT-Cutie: LSVOS挑战RVOS轨道的首个解决方案

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本研究解决了图像分割领域中强编码器缺乏的问题,提出了一个名为SAM2-UNet的框架,将Segment Anything Model 2作为编码器,与经典的U型解码器结合。实验结果表明,SAM2-UNet在多个下游任务中表现出优越性,超越了现有的专业最先进方法,具有广泛的应用潜力。

SAM2-UNet:Segment Anything 2为自然和医学图像分割提供强大的编码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-16T00:00:00Z

该论文介绍了AbdomenCT-1K数据集,包含1000多个腹部CT扫描,指出现有分割方法的局限性,并提出了四个基准和有效方法。研究评估了Segment Anything Model (SAM)在医学图像分割中的应用,发现其在CT数据上表现良好,但在密集实例分割上仍需改进。同时,研究探讨了SAM 2在2D和3D分割中的表现,为未来医学影像研究提供了重要参考。

基于Segment Anything Model 2的CT扫描腹部器官零样本三维分割研究:将视频跟踪能力应用于三维医学成像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z
LWiAI 播客 #177 - Instagram AI 机器人、Noam Shazeer -> 谷歌、FLUX.1、SAM2

在最新一期的LWiAI播客中,主持人讨论了Instagram推出的AI功能,用户可以创建自己的AI版本。此外,Waymo在旧金山推出了无人驾驶汽车,NVIDIA面临芯片延迟问题。还提到Meta的AI Studio和Noam Shazeer重返谷歌,以及欧盟AI法案的实施和对谷歌的调查。

LWiAI 播客 #177 - Instagram AI 机器人、Noam Shazeer -> 谷歌、FLUX.1、SAM2

Last Week in AI
Last Week in AI · 2024-08-11T20:16:41Z

本文介绍了SAM-Adapter在医学图像分割中的应用,显著提升了分割性能,超越了现有技术。同时,研究探讨了SAM2在医学图像和视频中的表现,提出了AdapterShadow和Uncertainty-aware Adapter等新方法,展示了在阴影检测和医学图像分割中的优越性。

SAM2-适配器:在下游任务(伪装、阴影、医学图像分割等)中评估与适配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本研究将Segment Anything Model(SAM)应用于数字病理学的语义分割任务,通过可训练的类别提示和病理基础模型提升了分割能力。实验结果显示,微调方案在Dice和IOU得分上显著优于传统方法。尽管SAM在推理时间和泛化能力上表现良好,但在密集实例分割方面仍需改进,未来的微调可能有助于提升其性能。

SAM2-PATH:一种更好的数字病理学语义分割模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

Meta AI Research 的 Segment Anything Model 2 (SAM2) 是一个用于图像和视频分割的模型。研究发现,SAM2 在自动模式下的对象辨识能力有所下降,因此提出了针对水下领域的 USIS-SAM 模型,表现优异。此外,AquaSAM 在水下图像分割中超越了默认的 SAM 模型,尤其在复杂任务中提升了准确性。整体来看,SAM2 在医学图像分割等领域的应用前景广阔。

评估 Segmentation Anything Model 2:SAM2 在水下环境中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码