BriefGPT - AI 论文速递 ·

R1-Zero在非SFT模型上的视觉推理“顿悟”

📝

内容提要

本研究解决了在多模态推理中复制复杂推理特征的挑战。通过在非SFT的2B模型上直接应用强化学习，我们成功实现了“顿悟”瞬间，并在CVBench上达到59.47%的准确率，较基线模型提高约30%。该工作的潜在影响在于为多模态推理的发展提供了新思路，同时揭示了传统方法的局限性。

➡️

继续阅读

商汤视觉AI荣膺全球三料第一，海外业务成增长引擎
近日，全球权威科技研究机构Omdia发表《Video Analytics Market Share》报告，商汤科技凭借视觉AI领域11年的深厚积累和扎实技...
世界模型有触觉了！50万小时视频，训出首个隐式触觉世界动作模型
AI对齐是什么？RLHF奖励模型刷分游戏，目标错配骗了谁
玩AI不聊对齐，就像吃火锅不聊蘸料——但你真的知道你蘸的是啥吗？大语言模型对齐这个词最近火得不行。但大部分人聊它的时候，连它到底在对齐啥都说不清。今天咱...
派早报：月之暗面开源 Kimi K3 模型等
少数派的近期动态那个让你放松娱乐、拥抱心流、逃离纷扰或找回真我的角落，是如何构建起来的？「角落新声」征文活动火热征稿中你可能错过的文章角落新声｜不再烧Hi...
不是模型变慢了，是任务变大了 - 肘子的 Swift 周报 #146
最近，即便是一些我认为并不算复杂的工作，AI 交付结果也常常需要几分钟，甚至几十分钟。这让我产生了一种错觉：难道随着模型能力不断增强，速度只能越来越慢？
基于大模型推理与MCP工具调用，斯坦福大学AI X射线科学家在同步辐射光源自主完成单晶衍射对准
AI X 射线科学家」的意义，并不在于取代实验人员，而是让 AI 从数据分析工具进一步走进实验现场，参与设备操作、状态判断和策略调整。尽管目前仍受限于样品...