小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。

IDEA-Research推出的一系列检测、分割模型:从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法 算法之道
结构之法 算法之道 · 2025-08-07T05:59:08Z

本研究提出MGD-SAM2模型,旨在提高高分辨率无类别分割的细粒度细节分割精度。通过整合多视角特征,模型显著增强了局部细节和全局语义的提取能力,实验结果表明其在多个数据集上表现优异。

MGD-SAM2: A Second-Generation Universal Segmentation Model with Multi-View Guided Detail Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了改进版SAM2模型,旨在提升图像和视频分割模型在跨领域适应性和泛化能力方面的表现。尽管特定领域适应性仍需进一步研究,但其在医疗成像等专业领域的应用潜力巨大。

SAM2在图像和视频分割中的应用:一项全面的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

AIxiv报道了字节跳动与北大等机构联合提出的多模态大模型Sa2VA,该模型结合了SAM-2和LLaVA的优势,实现了视频和图像的细粒度理解,支持多种任务,表现优异。

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

机器之心
机器之心 · 2025-02-12T05:22:57Z
Kdenlive 推出背景去除工具等功能,为2025 年做好准备

Kdenlive 是一款流行的开源视频编辑器,计划在 2025 年推出背景移除工具,目前已进入 alpha 测试阶段。该工具基于 SAM2 对象分割,支持 Linux 和 Windows 平台。

Kdenlive 推出背景去除工具等功能,为2025 年做好准备

实时互动网
实时互动网 · 2024-12-30T02:36:48Z

本研究提出了一种新的干扰物感知记忆模型SAM2.1++,旨在提高视觉物体跟踪的分割精度和稳定性。实验结果表明,该模型在七个基准测试中优于现有方法,并在六个测试中创下新纪录。

A Distractor-Aware Memory Model for Visual Object Tracking (SAM2)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究探讨了Segment Anything Model 2(SAM2)在视频伪装目标分割(VCOS)中的应用和性能,解决了伪装物体难以检测的难题。研究中评估了SAM2在不同数据集上的表现,并通过与现有多模态大语言模型的整合及特定的数据集微调,发现SAM2在视频中的伪装物体检测中具备出色的零样本能力,这一能力可以通过调整参数进一步提升。

当SAM2遇上视频伪装目标分割:全面评估与适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-27T00:00:00Z

本研究针对现有医学图像分割模型在少量标注数据下表现不佳的问题,提出了一种新的方法FS-MedSAM2。通过充分利用SAM2的训练记忆注意模块和处理掩码提示的能力,该方法在两个公开医学图像数据集上超越了当前的最先进技术,展示了其显著的应用潜力。

FS-MedSAM2:探索SAM2在无微调情况下的少量医学图像分割潜力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-06T00:00:00Z

本研究探讨了现有的分割基础模型在处理生物医学图像和视频方面的应用,尤其聚焦于SAM2模型的适用性和局限性。通过适应和微调,研究指出SAM2在不同数据集和任务中的表现存在差异,但在减少注释负担和实现零-shot分割方面展现出潜力。该工作强调了填补自然与医学图像领域差距的重要性,促进了临床应用的发展。

释放SAM2在生物医学图像和视频中的潜力:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-23T00:00:00Z

本研究解决了图像分割领域中强编码器缺乏的问题,提出了一个名为SAM2-UNet的框架,将Segment Anything Model 2作为编码器,与经典的U型解码器结合。实验结果表明,SAM2-UNet在多个下游任务中表现出优越性,超越了现有的专业最先进方法,具有广泛的应用潜力。

SAM2-UNet:Segment Anything 2为自然和医学图像分割提供强大的编码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-16T00:00:00Z
LWiAI 播客 #177 - Instagram AI 机器人、Noam Shazeer -> 谷歌、FLUX.1、SAM2

在最新一期的LWiAI播客中,主持人讨论了Instagram推出的AI功能,用户可以创建自己的AI版本。此外,Waymo在旧金山推出了无人驾驶汽车,NVIDIA面临芯片延迟问题。还提到Meta的AI Studio和Noam Shazeer重返谷歌,以及欧盟AI法案的实施和对谷歌的调查。

LWiAI 播客 #177 - Instagram AI 机器人、Noam Shazeer -> 谷歌、FLUX.1、SAM2

Last Week in AI
Last Week in AI · 2024-08-11T20:16:41Z

本文介绍了SAM-Adapter在医学图像分割中的应用,显著提升了分割性能,超越了现有技术。同时,研究探讨了SAM2在医学图像和视频中的表现,提出了AdapterShadow和Uncertainty-aware Adapter等新方法,展示了在阴影检测和医学图像分割中的优越性。

SAM2-适配器:在下游任务(伪装、阴影、医学图像分割等)中评估与适配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本研究将Segment Anything Model(SAM)应用于数字病理学的语义分割任务,通过可训练的类别提示和病理基础模型提升了分割能力。实验结果显示,微调方案在Dice和IOU得分上显著优于传统方法。尽管SAM在推理时间和泛化能力上表现良好,但在密集实例分割方面仍需改进,未来的微调可能有助于提升其性能。

SAM2-PATH:一种更好的数字病理学语义分割模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

Meta AI Research 的 Segment Anything Model 2 (SAM2) 是一个用于图像和视频分割的模型。研究发现,SAM2 在自动模式下的对象辨识能力有所下降,因此提出了针对水下领域的 USIS-SAM 模型,表现优异。此外,AquaSAM 在水下图像分割中超越了默认的 SAM 模型,尤其在复杂任务中提升了准确性。整体来看,SAM2 在医学图像分割等领域的应用前景广阔。

评估 Segmentation Anything Model 2:SAM2 在水下环境中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

本文研究了Meta AI Research的分割模型SAM在伪装目标检测中的表现,并提出通过适配器提升其性能的可能性。尽管SAM在多个领域表现良好,但在透明物体检测中存在不足,尤其在安全关键场景中可能带来风险。研究呼吁对SAM进行进一步探索,以推动其在遥感图像分析等领域的应用。

评估 SAM2 在伪装目标检测中的作用:从 SAM 到 SAM2

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

Meta发布了第二代“Segment Anything AI”——SAM2,它现在可以进行实时视频分割和跟踪。该模型的代码、权重和数据集都是开源的。SAM2使用选择和细化的两步过程来交互式地分割视频中的对象。它还引入了一个记忆模块来处理视频分割中的对象运动、变形、遮挡和光照变化等挑战。该模型在一个名为SA-V的大规模数据集上进行了训练,该数据集包含51,000个真实世界的视频和600,000个时空掩模。SAM2能够处理长视频,并为模糊的对象生成多个掩模。该模型在解决过分分割问题方面表现出了良好的性能。然而,在某些情况下,它仍可能会丢失对象的跟踪,并且对于快速移动的对象可能会有困难。该模型是开源的,可免费使用。

Meta「分割一切」进化2.0!跟踪运动物体,代码权重数据集全开源

量子位
量子位 · 2024-07-30T07:08:48Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码