小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。

IDEA-Research推出的一系列检测、分割模型:从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法 算法之道
结构之法 算法之道 · 2025-08-07T05:59:08Z

本研究提出MGD-SAM2模型,旨在提高高分辨率无类别分割的细粒度细节分割精度。通过整合多视角特征,模型显著增强了局部细节和全局语义的提取能力,实验结果表明其在多个数据集上表现优异。

MGD-SAM2: A Second-Generation Universal Segmentation Model with Multi-View Guided Detail Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了改进版SAM2模型,旨在提升图像和视频分割模型在跨领域适应性和泛化能力方面的表现。尽管特定领域适应性仍需进一步研究,但其在医疗成像等专业领域的应用潜力巨大。

SAM2在图像和视频分割中的应用:一项全面的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

AIxiv报道了字节跳动与北大等机构联合提出的多模态大模型Sa2VA,该模型结合了SAM-2和LLaVA的优势,实现了视频和图像的细粒度理解,支持多种任务,表现优异。

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

机器之心
机器之心 · 2025-02-12T05:22:57Z
Kdenlive 推出背景去除工具等功能,为2025 年做好准备

Kdenlive 是一款流行的开源视频编辑器,计划在 2025 年推出背景移除工具,目前已进入 alpha 测试阶段。该工具基于 SAM2 对象分割,支持 Linux 和 Windows 平台。

Kdenlive 推出背景去除工具等功能,为2025 年做好准备

实时互动网
实时互动网 · 2024-12-30T02:36:48Z

本研究提出了一种新型干扰物感知记忆模型及更新策略,以提升视觉物体跟踪的精度和稳定性。改进后的SAM2.1++在七个基准测试中超越现有方法,并在六个测试中创下最佳记录。

一种考虑干扰物的视觉物体跟踪记忆模型(SAM2)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究探讨了Segment Anything Model 2(SAM2)在视频伪装目标分割(VCOS)中的应用和性能,解决了伪装物体难以检测的难题。研究中评估了SAM2在不同数据集上的表现,并通过与现有多模态大语言模型的整合及特定的数据集微调,发现SAM2在视频中的伪装物体检测中具备出色的零样本能力,这一能力可以通过调整参数进一步提升。

当SAM2遇上视频伪装目标分割:全面评估与适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-27T00:00:00Z

本研究针对现有医学图像分割模型在少量标注数据下表现不佳的问题,提出了一种新的方法FS-MedSAM2。通过充分利用SAM2的训练记忆注意模块和处理掩码提示的能力,该方法在两个公开医学图像数据集上超越了当前的最先进技术,展示了其显著的应用潜力。

FS-MedSAM2:探索SAM2在无微调情况下的少量医学图像分割潜力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-06T00:00:00Z

本文评估了Segment Anything Model 2(SAM2)在类别无关实例级分割任务中的表现,并填补了现有研究中的评测空白。研究发现SAM2在不同场景中的性能差异,以及对高分辨率结构分割的局限性。建议利用SAM2适配器提升大规模视觉模型在该领域的性能上限。

针对类别无关实例级分割的SAM 2评估研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本研究探讨了现有的分割基础模型在处理生物医学图像和视频方面的应用,尤其聚焦于SAM2模型的适用性和局限性。通过适应和微调,研究指出SAM2在不同数据集和任务中的表现存在差异,但在减少注释负担和实现零-shot分割方面展现出潜力。该工作强调了填补自然与医学图像领域差距的重要性,促进了临床应用的发展。

释放SAM2在生物医学图像和视频中的潜力:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-23T00:00:00Z

本研究解决了图像分割领域中强编码器缺乏的问题,提出了一个名为SAM2-UNet的框架,将Segment Anything Model 2作为编码器,与经典的U型解码器结合。实验结果表明,SAM2-UNet在多个下游任务中表现出优越性,超越了现有的专业最先进方法,具有广泛的应用潜力。

SAM2-UNet:Segment Anything 2为自然和医学图像分割提供强大的编码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-16T00:00:00Z
LWiAI 播客第177集 - Instagram AI 机器人,Noam Shazeer 重返 Google,FLUX.1,SAM2

本期节目主要讨论了AI领域的重大更新和讨论,包括Instagram的新AI功能、Waymo在旧金山推出无人驾驶汽车以及NVIDIA的芯片延迟等。还涉及到Meta的AI Studio、character.ai首席执行官Noam Shazir重返Google以及Google的Gemini更新等话题。此外,还讨论了NVIDIA的硬件问题、人形机器人的进展以及像Open Devon这样的新开源AI工具。政策讨论涉及到欧盟的AI法案、美国对开源AI的立场以及对Google和Anthropic的调查。还强调了通过深度伪造技术传播的虚假信息的影响,特别是涉及到埃隆·马斯克的一个案例,强调了重要的行业影响和监管影响。

LWiAI 播客第177集 - Instagram AI 机器人,Noam Shazeer 重返 Google,FLUX.1,SAM2

Last Week in AI
Last Week in AI · 2024-08-11T20:16:41Z

研究团队提出了Segment Anything Model 2(SAM 2),是一个用于图像和视频分割的基础模型。SAM 2是一个简单的Transformer架构,具有流式存储器,用于实时视频处理。在广泛的任务中,SAM 2表现出强大的性能,视频分割中使用3倍少的交互获得更好的准确性,图像分割中比SAM模型更准确且速度快6倍。研究团队将发布模型版本、数据集和交互式演示。

SAM2-适配器:在下游任务(伪装、阴影、医学图像分割等)中评估与适配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

Segment Anything Model (SAM)推动了生物医学影像分析领域的进展。研究发现,SAM在解决临床挑战方面仍有改进空间,特别是对于颈动脉、肾上腺、视神经和下颌骨的分割。调查深入研究了SAM的创新技术和在医学影像场景中的应用。

SAM2-PATH:一种更好的数字病理学语义分割模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

研究团队提出了Segment Anything Model 2(SAM 2),是一个解决图像和视频中可提示的视觉分割的基础模型。SAM 2是一个简单的Transformer架构,具有流式存储器,用于实时视频处理。在广泛的任务中,SAM 2表现出强大的性能,比之前的方法使用更少的交互获得更好的准确性。研究团队相信他们的数据、模型和见解将成为视频分割和相关感知任务的重要里程碑。他们将发布模型的一个版本、数据集和一个交互式演示。

评估 Segmentation Anything Model 2:SAM2 在水下环境中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

最近的研究显示,SAM2在医学数据中实现了准确高效的分割。研究人员还开发了迁移学习流程,证明SAM2可以快速适应医学领域。此外,他们还将SAM2实现为3D切片插件和Gradio API,用于高效的3D图像和视频分割。

医学图像和视频中的任意分割:基准与部署

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

Meta AI 研究的 Segment Anything Model (SAM) 是一个广受认可的对象分割模型。为了将其应用扩展到视频,Meta 开发了 Segment Anything Model 2 (SAM2),一个用于视频和图像分割的统一模型。然而,最近的一份报告表明,SAM2 在没有提示的情况下区分图像中的对象的能力低于 SAM。该报告鼓励对 SAM 模型系列进行进一步探索。

评估 SAM2 在伪装目标检测中的作用:从 SAM 到 SAM2

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

Meta发布了第二代“Segment Anything AI”——SAM2,它现在可以进行实时视频分割和跟踪。该模型的代码、权重和数据集都是开源的。SAM2使用选择和细化的两步过程来交互式地分割视频中的对象。它还引入了一个记忆模块来处理视频分割中的对象运动、变形、遮挡和光照变化等挑战。该模型在一个名为SA-V的大规模数据集上进行了训练,该数据集包含51,000个真实世界的视频和600,000个时空掩模。SAM2能够处理长视频,并为模糊的对象生成多个掩模。该模型在解决过分分割问题方面表现出了良好的性能。然而,在某些情况下,它仍可能会丢失对象的跟踪,并且对于快速移动的对象可能会有困难。该模型是开源的,可免费使用。

Meta「分割一切」进化2.0!跟踪运动物体,代码权重数据集全开源

量子位
量子位 · 2024-07-30T07:08:48Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码