谢赛宁加入LeCun创办的初创公司AMI,完成10.3亿美元融资,估值达35亿美元。AMI专注于开发理解现实世界的智能系统,团队成员多来自Meta。LeCun继续担任董事长,推动世界模型研究。
LeCun创办的Advanced Machine Intelligence(AMI)估值247亿,专注于世界模型,强调开源和理解真实世界的重要性。他批评Meta的决策失误,认为其难以将研究转化为产品。AMI计划在多个城市设立机构,吸引顶尖人才。
谢赛宁团队的新论文iREPA源于一次推特辩论,研究空间结构对生成性能的影响。结果表明,空间结构对生成质量的影响超过全局语义,iREPA实现简单,仅需3行代码,显著提升性能。
寒武纪项目由谢赛宁、李飞飞和LeCun主导,推出了Cambrian-S模型,专注于提升AI的空间感知能力。该模型通过多模态视频理解,解决了传统模型在长视频处理中的不足,取得了显著进展。
字节Seed的康炳易团队推出Depth Anything 3(DA3),该模型利用单一Transformer实现任意视图的3D重建,提升了相机定位和几何重建的准确性。通过简化架构和核心预测,DA3能够从单图、多图或视频中提取深度和光线信息,展现出强大的性能和广泛的应用潜力。
谢赛宁团队的新研究表明,VAE时代已结束,RAE(表征自编码器)将取而代之。RAE结合预训练编码器与轻量解码器,提供高质量重建和快速收敛,尤其在图像生成方面表现优异,克服了VAE的多项局限。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
谢赛宁团队推出的MetaCLIP 2模型打破了“多语言诅咒”,支持300多种语言,并提升了英语性能。该模型通过全球数据训练,优化了数据筛选和模型结构,现已开源数据和代码。
近期,AI审稿人在期刊中被广泛使用,部分作者在论文中插入隐藏指令以操控AI给出好评。日本经济新闻报道,17篇论文中发现此类秘密指令,涉及多个国家的高校。这一事件引发了对AI审稿伦理的讨论,专家呼吁重新审视AI在学术中的应用界限。
AI时代,是时候重新思考学术伦理问题了
Blender Fusion框架结合图形工具与扩散模型,实现了对图像生成的精准控制。用户通过物体分层、Blender编辑和生成式合成,灵活操控图像中的物体,提升创作自由度,使AI图像合成更加直观,像搭积木一样编辑细节。
谢赛宁领导的华人团队推出了LiveCodeBench Pro编程竞赛基准,测试显示多款大模型在编程题上表现不佳,均得0分。该基准每日更新题库,旨在防止模型“背题”。结果表明,模型在逻辑和知识密集型问题上表现较好,但在观察密集型问题上能力不足,反映出算法推理和案例分析的短板。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。
谢赛宁的论文《深度监督网络》在被NeurIPS拒稿11年后,获得AISTATS 2025时间检验奖。他希望鼓励遭遇评审打击的学者,强调拒稿并不意味着失败。该论文提出的中间层监督方法已成为深度学习领域的重要成果,影响深远。
研究者探讨了无语言监督的视觉表征学习在多模态任务中的潜力,提出的Web-SSL模型在视觉问题解答(VQA)中表现优异,甚至超越了语言监督的方法。通过扩展数据和模型规模,视觉自监督学习在OCR和图表理解任务中展现出强大能力。
完成下面两步后,将自动完成登录并继续当前操作。