小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
DreamZero——同时统一预测未来视觉状态与动作的世界动作模型:解决当下VLA如果人类不示教则理论强但具体操作不强的弊病,且提升任务泛化、本体泛化

DreamZero是一种新型世界动作模型,通过联合预测视频和动作,提升机器人在新环境中的泛化能力。与传统模型相比,DreamZero能够高效学习多样化技能,支持零样本泛化,并实现实时控制。其核心在于利用预训练的视频扩散模型,结合自回归架构和优化策略,提高推理速度和准确性。

DreamZero——同时统一预测未来视觉状态与动作的世界动作模型:解决当下VLA如果人类不示教则理论强但具体操作不强的弊病,且提升任务泛化、本体泛化

结构之法 算法之道
结构之法 算法之道 · 2026-02-08T09:16:32Z

P5是一个统一的推荐系统框架,通过将用户交互、描述和评论等数据转化为自然语言序列,实现个性化推荐。它在预训练阶段学习多种任务,具备良好的零样本泛化能力,有效提升推荐系统性能。

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z
[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

P5是一个统一的推荐系统框架,通过个性化提示和预训练模型提升推荐任务的泛化能力。它将用户-物品交互数据转化为自然语言序列,支持多种推荐任务,实验结果显示P5在多个基准测试中表现优异,具备零样本泛化能力。

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z

医学影像技术在诊断中至关重要,人工智能的发展推动了影像异常检测的进步。北京大学提出的MediCLIP方法能够在仅有少量正常影像的情况下有效检测异常,展现出良好的零样本泛化能力。

在线教程丨仅需极少量医学影像数据,MediCLIP 在异常检测与定位任务中刷新 SOTA

HyperAI超神经
HyperAI超神经 · 2025-08-12T04:02:30Z

MediCLIP是一种高效的小样本医学影像异常检测方法,能够在仅有少量正常影像的情况下实现优异性能,适用于多种医学影像类型,并展现出良好的零样本泛化能力。

在线教程丨仅需极少量医学影像数据,MediCLIP在异常检测与定位任务中刷新SOTA

HyperAI超神经
HyperAI超神经 · 2025-08-12T03:39:38Z

本研究提出EndoVLA模型,旨在解决传统内窥镜操作中对异常区域追踪能力不足和手动调优负担重的问题。该模型结合内窥镜图像与医生提示,整合视觉、语言和运动规划,采用双阶段策略,显著提升追踪性能和零样本泛化能力。

EndoVLA: A Dual-Phase Vision-Language-Action Model for Autonomous Tracking in Endoscopy

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z
Meta AI 推出感知编码器:一款大规模视觉编码器,在图像和视频的多项视觉任务中表现出色

Meta AI推出的感知编码器(PE)通过单一对比学习目标,构建了一个通用视觉编码器,支持多种视觉任务,如图像和视频分类、检索等,展现出强大的零样本泛化能力,为多模态AI系统奠定了高效基础。

Meta AI 推出感知编码器:一款大规模视觉编码器,在图像和视频的多项视觉任务中表现出色

实时互动网
实时互动网 · 2025-04-22T02:10:36Z
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

上海人工智能实验室开源了生成式世界模型AETHER,该模型基于合成数据训练,具备3D空间决策与规划能力。它结合几何重建与生成建模,提升了动态环境中的智能决策能力,支持目标导向视觉规划、4D动态重建和动作条件视频预测,展现出强大的零样本泛化能力。

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

机器之心
机器之心 · 2025-04-20T06:31:01Z

本文介绍了一种新型时间序列大模型PCTLM,克服了传统模型在复杂模式捕捉和零样本泛化能力上的不足。通过构建15亿样本的数据集和强化学习框架TPO,PCTLM在多个公开数据集上取得了SOTA效果,优于现有模型,并已成功应用于京东供应链系统。

【灯塔计划】供应链时序大模型探索

京东科技开发者
京东科技开发者 · 2025-04-11T02:03:37Z
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

FoundationStereo是一种用于立体深度估计的基础模型,具有强大的零样本泛化能力。通过构建100万对合成立体图像,并结合自筛选流程和创新网络架构,显著提升了模型的鲁棒性和精度,设立了新标准。该模型在多个排行榜上表现优异,相关代码已开源。

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

机器之心
机器之心 · 2025-04-06T02:08:39Z

本研究提出了统一框架Aether,旨在解决几何重建与生成建模的挑战。Aether通过联合优化实现几何感知推理,能够在没有真实数据的情况下进行零样本泛化,其重建性能超越领域特定模型,展现出在物理建模中的潜力。

艾瑟:几何感知统一世界建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

AIxiv专栏促进学术交流,报道超过2000篇内容。北大与智元机器人团队提出OmniManip架构,解决视觉语言模型在机器人操作中的挑战,实现高效低层次动作。该系统通过双闭环设计显著提升操作性能,展现强大的零样本泛化能力。

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

机器之心
机器之心 · 2025-01-22T05:20:16Z

本研究提出了EasyRef方法,利用多模态大语言模型解决传统方法在处理多张图像时缺乏交互的问题。实验结果表明,EasyRef在美学质量和零样本泛化能力上优于现有方法。

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

AI版《黑客帝国》由华人团队开发,能够生成720p高保真视频并实现实时交互,支持零样本泛化,结合游戏与现实场景数据,具备精确控制和流畅生成能力。

AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互

量子位
量子位 · 2024-11-21T04:17:32Z

本研究提出了一种基于异构时空图的机器人导航框架,针对拥挤和受限环境中的导航问题。通过深度强化学习,该方法显著提高了导航的成功率和效率,并具备良好的零样本泛化能力。

HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

清华大学研究团队在具身智能领域取得突破,发现数据规模法则使机器人实现零样本泛化,能够适应新环境。研究表明,数据质量比数量更为重要,未来机器人将在日常生活中得到更广泛应用。

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

机器之心
机器之心 · 2024-11-01T02:21:00Z

本研究引入Llama-3-8B-Mob模型,解决了传统出行预测方法在多样化城市环境中的短期预测不足问题,实现了对未来15天的城市长期出行预测,结果优于现有方法,展现出强大的零样本泛化能力。

指令调优的Llama-3-8B在城市规模的出行预测中表现优秀

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出了一种属性树提示学习方法,通过生成“概念-属性-描述”的结构化知识树,解决视觉-语言模型在提示学习中未充分利用类别名称上下文的问题。该方法引入视觉和文本提示,显著提升了零样本泛化、跨数据集迁移和少样本分类的性能。

属性树提示学习在视觉-语言模型中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本研究提出了一种通用抓握策略,通过模拟人手控制,设计了基于人手特征的统一动作空间。在不同机器人手上的成功率达80%,并具备良好的零样本泛化能力。

Reinforcement Learning for Cross-Embodiment Dexterous Grasping

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本研究讨论了第三届单目深度估计挑战赛(MDEC)的结果,重点关注挑战赛对SYNS-Patches数据集的零样本泛化。挑战赛接收了19份提交报告,其中有10份报告详细描述了他们的方法,突出了在方法核心使用了Depth Anything等基础模型的广泛应用。挑战赛获胜者将3D F-Score性能从17.51%提高到23.72%。

第三届单目深度估计挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码