➡️
继续阅读
-
论文周报 |微软MAI-Thinking探索纯RL自我进化,AIME准确率达97%;无需架构修改,VLM³凭纯文本坐标实现3D任务泛化...速览一周AI前沿论文
微软 AI 团队提出了「爬山机器」框架,并训练了参数达到 1T 的 MoE 模型 MAI-Thinking-1。该模型通过自适应熵控制的强化学习,在无第三...
-
将最新的Gemini模型带给苹果开发者
苹果全球开发者大会(WWDC)宣布,开发者可以通过Foundation Models框架安全调用云端Gemini模型,提升开发效率。Gemini模型与iO...
-
小米MiMo-v2.5-Pro-UltraSpeed模型推理速度达000tokens/s
小米MiMo-v2.5-Pro-UltraSpeed模型的推理速度达到每秒1000词,改变了人机互动方式。快速的AI提升了用户的对话和协作效率,而慢速模型...
-
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
三维空间感知是自动驾驶和机器人领域的核心能力,旨在从二维图像恢复真实世界的空间结构。Meta与普林斯顿大学提出的VLM³框架,基于标准视觉语言模型,统一了...
-
大语言模型正在变成大编程模型
随着Claude Opus 4.7和4.8的推出,关于新模型语言能力下降的讨论增多。Arena AI的数据分析显示,基础模型的编程能力显著提升,几乎是语言...
-
NVIDIA 发布 Nemotron 3.5 ASR:一个拥有 6 亿参数、支持缓存的流式转录模型,可实时转录 40 种语言区域设置
NVIDIA发布了Nemotron 3.5 ASR,这是一个支持40种语言的流式自动语音识别模型,拥有6亿参数。该模型采用FastConformer-RN...