Recursive Superintelligence(RSI)是一家新成立的AI公司,获得6.5亿美元融资,估值46.5亿美元。创始团队由8位顶尖科学家组成,目标是开发自我改进的AI系统,自动化科学研究,特别是在药物研发和材料科学领域。RSI希望通过递归自我改进,解决AI行业的增长瓶颈,推动下一次能力跃迁。
LeCun指责Meta在Llama4项目中作弊,导致团队信任崩溃,田渊栋因压力接手项目。两人选择离职创业,LeCun成立新公司专注于世界模型,田渊栋则拒绝大厂邀请,宣布创业。
Nano Banana Pro推出新功能,可以将论文转化为漫画,并实现逼真的手写解题效果。谷歌利用该技术提升股价,CEO劈柴哥还修正了8年前的emoji错误,展示了AI技术的进步。
Meta首席执行官扎克伯格批准裁员约600名AI部门员工,主要集中在“超智能实验室”。此次裁员旨在提升团队效率,反映AI领域的战略调整与市场压力。新招募的顶尖人才未受影响,显示出对新人的重视,裁员也引发行业人才争夺,凸显AI人才市场供需失衡。
田渊栋在Meta裁员后迅速找到新工作,裁员涉及约600人,因Llama 4表现不佳。Meta裁员旨在提升团队效率,部分员工获得遣散费。田渊栋受到多个AI公司的青睐,显示他机会众多。
Meta裁员影响了围棋AI“Dark Forest”的开发者田渊栋,他在Meta工作近十年,专注于AI可解释性与基础原理,近期发表新论文并计划出版科幻小说。
田渊栋团队的研究表明,连续思维链通过“叠加态”实现并行搜索,显著提高复杂任务的推理效率。与传统离散思维链相比,连续思维链能够同时编码多个路径,优化图可达性问题的解决,实验准确率接近100%。
田渊洞在访谈中探讨了博士生内心驱动力与外部反馈的关系,分析了追求颠覆性研究与注重实用性改进的两类研究者。他认为这两类研究者都很重要,未来可能会在危机中合并,强调技术领导者需把握方向,促进团队协作。
Meta FAIR与加州大学伯克利分校研究团队提出了新基准ColBench,并开发了多轮强化学习算法SWEET-RL,旨在提升大型语言模型在复杂协作任务中的表现。该算法通过直接学习每轮的优势函数,显著提高了智能体在编程和设计任务中的成功率。
Meta提出的CoCoMix框架结合稀疏自编码器和连续概念,提升了大型语言模型(LLMs)的性能,减少了21.5%的训练token,显示出更高的采样效率和可解释性。
研究者提出了一种新方法Coconut,通过在潜在空间中推理,提升了大语言模型(LLM)的推理能力。该方法直接利用最后的隐藏状态作为输入,避免了传统语言空间的限制。实验结果显示,Coconut在数学和逻辑推理任务中表现优于基于语言的推理方法,尤其在复杂规划任务中更具优势。
Meta的田渊栋团队开发了Dualformer模型,结合快慢思考,提升性能并降低推理成本。该模型通过训练推理轨迹和最终答案,解决复杂问题。在慢思考模式下,最优解率达97.6%,推理步骤减少45.5%;自动模式下最优率为96.6%,推理步骤减少59.9%。模型基于Searchformer,采用丢弃策略优化推理过程。
Meta FAIR团队提出Dualformer,一种受人类认知理论启发的新型Transformer架构。它结合快速直觉的系统1和深思熟虑的系统2,通过随机化推理轨迹训练,在推理时选择快速或慢速模式,提高效率和能力。实验显示,Dualformer在迷宫和推箱子任务中优于基线模型,并在数学推理中表现更高效。
完成下面两步后,将自动完成登录并继续当前操作。