➡️
继续阅读
-
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
三维空间感知是自动驾驶和机器人领域的核心能力,旨在从二维图像恢复真实世界的空间结构。Meta与普林斯顿大学提出的VLM³框架,基于标准视觉语言模型,统一了...
-
黄仁勋访韩!英伟达与SK海力士等韩企达成合作;Anthropic呼吁全球暂停AI开发;微信与华为小米等合作推出A2A助手能力
英伟达与SK海力士、Naver和斗山合作建设AI数据中心,并确认三星、SK海力士和美光获得HBM4供应资格。Anthropic呼吁全球暂停AI开发,认为快...
-
NVIDIA 发布 Nemotron 3.5 ASR:一个拥有 6 亿参数、支持缓存的流式转录模型,可实时转录 40 种语言区域设置
NVIDIA发布了Nemotron 3.5 ASR,这是一个支持40种语言的流式自动语音识别模型,拥有6亿参数。该模型采用FastConformer-RN...
-
OpenAI酝酿上线来最大升级:ChatGPT告别纯聊天,转型“超级应用”押注AI智能体
OpenAI计划对ChatGPT进行重大升级,转型为能够执行任务的AI智能体,提升Codex编程工具和图像生成模块的功能。预计到年底,企业客户收入占比将达...
-
OpenAI收购Cloudflare的真相:不是猜测,是时间问题
OpenAI收购Cloudflare旨在提升AI模型的响应速度和安全性。Cloudflare的全球网络基础设施能够加速数据传输并防御网络攻击,从而增强Op...
-
5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
JoyAI-Echo是京东推出的开源长视频生成框架,解决了角色一致性、音色稳定性和生成速度等问题。该框架通过跨模态音视频记忆库和记忆驱动后训练,确保角色在...