小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
结合多模态提示的统一开放世界分割

COSINE是一种开放世界图像分割模型,结合了开放词汇分割和上下文分割,支持多种输入模式(如图像和文本)。该模型利用基础模型的表示能力,能够准确分割特定概念,提升开放世界感知能力。实验结果表明,该方法在多种分割任务中表现有效。

结合多模态提示的统一开放世界分割

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-16T00:00:00Z

Google DeepMind发布Nano Banana Pro图像生成模型,支持4K和多语言文字。Meta推出SAM 3图像分割模型,提升创作效率。美国专利局计划限制IPR复审,可能加剧专利滥用。Valve推动Linux游戏生态,AI被认为宣传过度,实际效用有限。OpenAI推出GPT-5.1-Codex-Max,提升代码生成能力。高通收购Arduino引发隐私担忧。

2025 11 21 HackerNews

介绍 on SuperTechFans
介绍 on SuperTechFans · 2025-11-20T23:57:30Z

Meta推出的SAM 3模型实现了通过语言提示在图像中识别和分割多个实例。该模型支持多模态提示,具备快速处理和高准确率,但对复杂语言的理解能力有限。

Meta「分割一切」3.0曝光!技能语义分割加入概念提示,好好玩,要爆了

量子位
量子位 · 2025-10-13T03:43:53Z

华中科技大学与金山办公团队提出的多模态大模型LIRA,通过语义增强特征提取器和交错局部视觉耦合模块,提升了图像分割和理解的精度,解决了现有模型的不足。LIRA在多个基准测试中表现优异,已被ICCV 2025录用。

用两个简单模块实现分割理解双重SOTA!华科大白翔团队等推出多模态新框架

量子位
量子位 · 2025-10-03T04:51:08Z
评估图像分割模型在图像背景去除中的应用

文章介绍了Workers AI中实现的图像背景去除功能,利用图像分割模型将主体与背景分离。经过对多种模型的测试,最终选择BiRefNet模型进行背景去除。该功能已在Cloudflare的Images API中开放测试,用户可通过特定参数实现自动背景去除。

评估图像分割模型在图像背景去除中的应用

The Cloudflare Blog
The Cloudflare Blog · 2025-08-28T14:00:00Z

PAM(Perceive Anything Model)模型通过3B参数实现图像和视频的分割、识别与描述,支持多种输出,且数据已开源。该模型在多个基准测试中表现优异,具备高效推理和轻量化特点,适用于AR/VR等场景。

分割/识别/解说一个模型搞定!3B参数刷新视觉理解SOTA,图像视频全适配

量子位
量子位 · 2025-06-14T12:01:45Z
解码图像分割:从基本像素到全景完美

计算机视觉中的分割不仅是将图像切割成片段,更是为每个像素赋予意义。主要有四种分割类型:图像分割、语义分割、实例分割和全景分割。这些方法在细节和理解上各有不同,广泛应用于自动驾驶、医学成像和增强现实等领域。

解码图像分割:从基本像素到全景完美

DEV Community
DEV Community · 2025-05-21T05:59:37Z

本研究利用神经网络提高下颌关节MRI图像分割的准确性和速度。分析了94幅图像,比较多种模型,发现Roboflow模型在分割中表现优异,为病理诊断奠定基础。

Segmentation of Temporomandibular Joint Structures on MRI Images Using Neural Networks for Pathological Diagnosis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本文介绍了OpenCV中的连通组件标记算法,包括不带统计信息和带统计信息的API。该算法用于分析二值图像中相同像素值的集合,统计数量、面积、周长、质心和形状特征等,广泛应用于图像分割、目标检测和医学图像分析。

OpenCV4.8 开发实战系列专栏之 47 - 二值图像连通组件状态统计

gloomyfish
gloomyfish · 2025-05-06T02:44:58Z

本文探讨了传统矩形图像补丁注意机制在复杂视觉任务中的局限性,提出了一种基于图像分割的原型对象方法。该方法通过使用原型对象,显著降低了表示复杂性,并在参数更少、训练时间更短的情况下,实现了与最新补丁方法相当或更好的性能。

Neuroevolution of Self-Attention Over Proto-Objects

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本研究提出了一种混合Dense-UNet201优化方法,克服了传统Pap涂片图像分割模型在复杂细胞结构上的局限性。实验结果显示,该模型在图像分割中的精度达到96.16%,对医学图像分析具有重要意义。

Hybrid Dense-UNet201 Optimization for Pap Smear Image Segmentation Based on Spider Monkey Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出了改进版SAM2模型,旨在提升图像和视频分割模型在跨领域适应性和泛化能力方面的表现。尽管特定领域适应性仍需进一步研究,但其在医疗成像等专业领域的应用潜力巨大。

SAM2在图像和视频分割中的应用:一项全面的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
Go 语言字段验证工具:支持跨字段、跨结构体、多维数据 | 开源日报 No.530

validator 是 Go 语言的验证工具,支持多维数据和自定义验证;rawdog 是命令行助手,自动生成 Python 脚本;figma_clone 是实时协作设计工具,支持多用户互动;Segment-Everything-Everywhere-All-At-Once 是图像分割工具。

Go 语言字段验证工具:支持跨字段、跨结构体、多维数据 | 开源日报 No.530

开源服务指南
开源服务指南 · 2025-03-11T14:01:54Z

本研究提出了一种新架构SpliCER,旨在解决自监督表示学习在复杂特征学习中的不足。通过图像分割提取信息,提升下游应用表现,尤其在医疗和地理空间成像领域展现出良好潜力。

分而治之的自监督学习用于高内容成像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究推出肾脏病理图像分割挑战(KPIs Challenge),并引入包含10,000个肾小球标注的CKD大鼠模型数据集,旨在建立肾脏病理分析的新基准,以促进疾病研究与诊断。

2024 KPIs Challenge: Advancing Glomerulus Segmentation from Block Level to Whole Slide Level

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了一种新颖的测试时间训练框架,解决了4D医学图像插值中的分布变化问题,提升了时间分辨率和诊断精度。实验结果表明,该方法在多个评估指标上表现优异,为图像分割和配准提供了有效的适应模板。

Test Time Training for 4D Medical Image Interpolation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本研究提出了量子特征提取模块QuFeX,旨在解决传统量子卷积神经网络的高计算需求。QuFeX通过降维显著减少评估次数,Qu-Net在图像分割任务中优于传统U-Net,展示了其在精准特征提取方面的应用潜力。

QuFeX:用于混合量子-经典深度神经网络的量子特征提取模块

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

本文提出了一种名为SINE的图像分割框架,通过上下文示例解决任务模糊性。SINE基于Transformer结构,利用上下文交互模块和匹配Transformer生成多个任务特定的输出掩码,适用于多种分割任务。实验结果表明,SINE在少样本分割和视频目标分割等任务中表现优异。

SINE:上下文示例驱动,打造真正的通用分割模型 | NeurIPS'24 - 晓飞的算法工程笔记

晓飞的算法工程笔记
晓飞的算法工程笔记 · 2025-01-02T01:33:00Z

本研究提出了Spike2Former架构,以提升脉冲神经网络在图像分割中的性能。通过优化关键模块和归一化整数脉冲神经元,增强了训练的稳定性。实验结果表明,Spike2Former在多个数据集上显著提高了分割精度和效率。

Spike2Former: An Efficient Spiking Transformer for High-Performance Image Segmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究评估了旋转等变性在U-Net架构中的有效性,特别是在图像分割任务中的表现。通过与标准U-Net对比,探讨了旋转等变性对性能和可持续性的影响,发现其在更广泛应用中具有潜在优势。

The Effectiveness of Rotation Equivariance in U-Net: A Benchmark Study for Image Segmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码