小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Saronic Technologies’ autonomous surface vessels are ushering in a new era for maritime in the United States. Cofounder and CEO Dino Mavrookas discusses the company’s mission and approach.

Dino Mavrookas on shipbuilding’s autonomous future

McKinsey Insights & Publications
McKinsey Insights & Publications · 2026-03-04T00:00:00Z

本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。

IDEA-Research推出的一系列检测、分割模型:从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法 算法之道
结构之法 算法之道 · 2025-08-07T05:59:08Z
Adirik在Replicate上发布的Grounding-Dino模型初学者指南

Grounding-Dino是由Adirik维护的AI模型,能够通过文本输入检测图像中的物体。它结合了DINO检测器和基础预训练,支持开放词汇和文本引导的物体检测,输出带有边界框和标签的结果。

Adirik在Replicate上发布的Grounding-Dino模型初学者指南

DEV Community
DEV Community · 2025-04-13T06:40:36Z

港大马毅团队推出SimDINO和SimDINOv2,通过编码率正则化简化DINO系列模型的训练流程,提升了模型的鲁棒性和性能。这些新模型去除了复杂的后处理步骤,使训练更简单且效果更佳,体现了“简单即是美”的设计理念。实验结果显示,SimDINO系列在多个任务上优于DINO,具备更高的计算效率和稳定性。

港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”

量子位
量子位 · 2025-03-08T04:01:38Z
简化自监督视觉:编码率正则化如何改变 DINO 和 DINOv2

DINO和DINOv2模型用于从未标记图像中学习特征,但训练复杂且不稳定。SimDINO和SimDINOv2通过引入编码率正则化项,简化了训练过程,提高了稳定性和效率,表现优于前者,适合视觉自监督学习。

简化自监督视觉:编码率正则化如何改变 DINO 和 DINOv2

实时互动网
实时互动网 · 2025-02-28T02:58:31Z

本文解决了DINO及DINOv2模型在无标记图像数据学习中的复杂性和不稳定性问题。通过在损失函数中引入显式的编码率项,提出了简化版本SimDINO和SimDINOv2,这些模型在不同设计选择下表现出更高的鲁棒性,且在下游任务上学习到了更高质量的表征,展示了简化设计原则在深度学习中的潜力。

通过编码率正则化简化DINO

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-14T00:00:00Z

DINO是一种自监督学习方法,通过知识蒸馏提升视觉Transformer的特征质量。它动态构建教师网络,利用学生网络输出进行训练,优化图像特征学习。DINO采用多裁剪策略和温度softmax,提升模型性能。

从DINO、Grounding Dino到DINOv2、DINO-X——自监督视觉Transformer的升级改进之路(基于ViT)

结构之法 算法之道
结构之法 算法之道 · 2024-12-21T15:49:35Z

本研究针对CLIP在细粒度任务中的视觉特征不足问题,提出了一种无标签提示调整方法,利用自监督学习模型DINO的丰富视觉特征和大型语言模型的广泛文本知识,显著提升了基于CLIP的图像分类性能。研究结果表明,提出的NoLA框架在11个多样化的图像分类数据集上,相较于当前最先进的无标签分类方法LaFter平均提升3.6%。

CLIP与DINO的结合:使用无标签图像集合调整零样本分类器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-28T00:00:00Z

本研究解决了开放词汇分割中图像与自由形式文本概念的分割问题,现有模型在空间定位方面存在困难。我们提出的Talk2DINO方法,结合了DINOv2的空间精确性与CLIP的语言理解,利用注意力图选择性地将视觉补丁与文本嵌入对齐,显著提高了分割质量及前景与背景的区分能力。实验结果表明,Talk2DINO在多个无监督OVS基准测试中表现优异。

与DINO对话:通过语言连接自监督视觉骨干以实现开放词汇分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-28T00:00:00Z

本文提出DINO-X模型,旨在提升开放世界物体检测的性能。通过扩展输入选项和构建大规模数据集,DINO-X显著增强了对长尾物体的识别能力,实验结果在多个基准测试中表现优异。

DINO-X:统一的开放世界物体检测与理解视觉模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本研究提出了一种新的注意力动态 DINO 框架,有效解决智能体在不同交互上下文中对手势和语言描述的误解问题,显著提升任务性能,尤其在 IoU 阈值为 0.75 时超越人类表现。

AD-DINO:基于注意力动态的距离感知实体引用理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

本研究提出DINO-LG模型,通过自监督学习提高冠状动脉钙化评分的准确性,专注于钙化区域,显著改善评分和分割性能,为冠状动脉疾病的预防提供更精确的工具。

任务特异性DINO模型用于冠状动脉钙化评分

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

该研究提出DINO-WM方法,利用DINOv2特征从离线轨迹中学习,解决世界模型学习的挑战,实现无任务依赖的行为规划,展现出良好的适应性和推广性。

基于预训练视觉特征的DINO-WM:实现零-shot规划的世界模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本研究探讨了多模态大型语言模型中不同视觉编码器的有效性,发现CLIP在细粒度任务中表现优异,而DINO经过简单对齐后也展现出良好性能。研究提出的特征融合策略COMM有效结合了CLIP和DINO,显著提升了MLLMs的视觉能力。

预集成提示信息至视觉编码的多模态大语言模型框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z
垂直电商图像搜索再升级:DINO 模型带来精准匹配体验

文章介绍了一个高效的鞋服图片搜索系统,利用Amazon SageMaker和OpenSearch,实现低延迟、高精度搜索。通过目标检测和图像分割,系统能识别并剪切目标物品,提升搜索准确性。使用DINO模型预训练和微调,增强召回能力。实验显示,系统在前5个结果中达到85%准确率,适用于电商和医疗等行业。

垂直电商图像搜索再升级:DINO 模型带来精准匹配体验

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-10-16T06:26:04Z

研究发现,在多模态大型语言模型中,CLIP的浅层特征在细粒度任务中有优势。未经过文本-图像对齐预训练的DINO加上MLP层后表现优于CLIP。基于此,提出COMM策略,通过融合CLIP和DINO的特征提升视觉能力,实验结果显示其性能优越。

更好的语言模型是否具有更清晰的视觉?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

DiNO-Diffusion方法使用自监督学习训练潜在扩散模型,在医学影像领域展示了广泛的覆盖范围。它能够生成多样且小规模的合成数据集,通过数据增强提高了分类性能20%。此外,DiNO-Diffusion表现出良好的零样本分割性能和图像解剖对齐能力,可应用于其他医学影像模态或高级扩散模型,为医学影像领域的大规模多领域图像生成提供了可能性。

DiNO-Diffusion. 自监督预训练扩展医学扩散

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

研究发现自监督视觉预训练对像素学习运动控制任务有效。作者提出手工设计的基准任务,包括运动、场景和机器人等方面的变化。实验结果显示,通过视觉编码器和强化学习,成功率高达80%,能与理论最好状态匹敌。野外图像如YouTube和自我中心视频在各操作任务的视觉表现上优于ImageNet图像。

基于视觉的端到端自主驾驶的 DINO 预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

研究了基于便宜的输入提示的视觉任务基础模型SAM,发现其在零样本图像分割准确性上表现良好,但在航空图像问题中有时会失败。

自动图像数据标注的分段模型:基于 Grounding DINO 的文本提示的实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

DINO-vMF 使用混合模型的方法改进了 DINO 的集群分配概率计算,对于较大的 ViT-Base 模型也更加稳定且在各种下游任务中表现更好,提供了更好的图像表示。

DINO 作为 von Mises-Fisher 混合模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码