OpenAI CEO山姆·奥特曼在遭遇燃烧瓶袭击后,反思AI时代的焦虑与个人责任。他承认处理冲突不当,并对曾伤害的人表示歉意。他强调AI技术应民主化,避免权力集中,并呼吁社会建立应对机制,以应对技术带来的失业和恐惧。奥特曼的反思揭示了AI发展引发的社会情绪和不安。
2026年被称为具身原生元年,Generalist的GEN-1模型强调从零训练,专注于目标导向,摒弃现有技术路线。与原力灵机的DM0模型相似,二者追求数据原生、训练原生和架构原生,旨在实现物理AGI。
林俊旸因与Qwen团队管理分歧离开阿里。他认为AI正从“训练模型”转向“训练智能体”,强调在真实环境中持续互动与调整的重要性。未来竞争在于环境设计与系统工程能力,而非单一模型优化。
尤洋教授指出,AI智能增长面临瓶颈,尽管算力在提升,但转化效率却在下降。智能的核心在于预测能力,未来需探索更高效的计算方式,以实现算力与智能的有效转化。
AI短名单是对人工智能领域中重要技术、应用或研究的简要概述,旨在突出其关键特征和影响。
空间智能是人工智能的下一个前沿,李飞飞指出其核心能力包括生成、交互和多模态处理。通过构建世界模型,AI将更好地理解和创造现实与虚拟世界,推动各领域的创新与发展。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
Mamba探讨了状态空间模型(SSMs)与Transformer的优劣,指出Attention并非万能,SSMs在处理长序列信息时更具优势。Mamba在同规模下超越Transformer,强调混合模型的潜力,未来可能结合两者优势开发新架构。
腾讯推出首款开源混合推理模型Hunyuan-A13B,参数80B,激活参数13B,推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异,支持256K上下文窗口,适合个人开发者使用。同时,腾讯还开源了两个新数据集,以提升大语言模型的能力。
ChatGPT经历了一整晚的宕机,OpenAI推出了o3-pro模型,提升了在科学、编程和教育等领域的复杂问题处理能力。虽然o3-pro响应速度稍慢,但支持更多工具调用。OpenAI还与Google Cloud合作,以缓解算力压力,未来将实现更高效的AI服务。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
MCP协议逐渐流行,开发者积极参与Server/Client开发。本文介绍MCP的核心概念、传输机制及应用案例,帮助读者理解MCP与LLM的关系,并提供示例代码以供实践。
2025年,Deepseek R1等大语言模型的推理技术备受关注。研究者提出思维链和动态计算等改进策略,以提升模型的推理能力。通过增加训练和推理计算,模型在复杂任务中的表现显著提高,未来推理将成为大语言模型的标准配置,推动其在各领域的应用。
本文简要总结了一篇长文,感谢读者的阅读。
In my experience working on vault.pash.city, over 40% of user queries have been geared toward document summarization. Thousands of people often upload a document and have one straightforward yet...
Kimi的新论文提出了一种名为MoBA的长文注意力机制,能够将处理1M长文本的速度提升6.5倍。该机制通过将上下文划分为块,并利用top-k门控机制选择相关信息,从而提高长序列数据的处理效率。MoBA在保持模型性能的同时,支持全注意力与稀疏注意力模式的切换,具有良好的扩展性。
OpenAI宣布ChatGPT搜索功能免费开放,支持实时网页搜索和多语言翻译。Google推出支持4K视频生成的新视频模型Veo 2。苹果计划于2028年发布可折叠iPad。马斯克确认推出电子邮箱服务X Mail。极越CEO致歉,小米否认空调专利侵权。武汉大学成立人工智能学院,小马智行预计2025年Robotaxi生产成本将下降。
本研究提出了长文境指令跟随基准(LIFBench)及评估框架(LIFEval),旨在解决大型语言模型在处理长文输入时的指令跟随能力不足的问题,为未来模型开发提供重要见解。
完成下面两步后,将自动完成登录并继续当前操作。