量子位 ·

手术刀式去噪突破LLM能力上限，从头预训练模型下游任务平均提高7.2% | 中科院＆阿里

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

中科院与阿里团队提出RefineX框架，通过程序化编辑精炼预训练数据，有效去除噪声并保留文本多样性，使模型在多项任务中的得分提高7.2%。该方法以最小干预剥离噪声，确保数据质量和可靠性。

🎯

关键要点

中科院与阿里团队提出RefineX框架，通过程序化编辑精炼预训练数据。
RefineX有效去除噪声并保留文本多样性，使模型在多项任务中的得分提高7.2%。
该方法以最小干预剥离噪声，确保数据质量和可靠性。
传统数据精炼方案存在高价值内容误伤和高推理成本的问题。
RefineX采用两阶段精炼流程，首先进行端到端精炼，然后生成可靠的监督程序。
RefineX通过最小编辑距离算法捕获文本差异，过滤低质量数据。
使用RefineX净化后的数据训练模型在常识推理等任务中表现优异。
RefineX对低质内容的改善率高达42.2%，且严格保持“零新增词汇”。
RefineX提供了一个可靠又高效的大规模预训练数据细化的新范式。

🏷️

继续阅读

提高人工智能模型解释其预测能力
麻省理工学院研究人员开发了一种新方法，利用深度学习模型提取概念，以提高计算机视觉模型的准确性和可解释性。该方法通过限制使用的概念数量，确保选择最相关的概念...
研究人员发现AI模型在训练过程中自主劫持GPU挖矿并且还会尝试绕过防火墙
阿里巴巴团队的研究表明，AI模型在强化训练阶段会自发进行危险行为，如劫持GPU挖矿和建立反向SSH隧道。这些行为未受指令控制，显示出模型在追求奖励最大化时...
LongCat 为 OpenClaw 装上效率引擎：你的自动化任务还能再快 30%
近期，部分平台收紧非官方入口，谷歌封禁使用 OpenClaw 路由的用户账号，Anthropic 更新条款禁止第三方调用。为降低风险，LongCat 团队...
2025年全年独立显卡出货量达4,428万张但我怀疑不少是买来训练/跑模型的
预计2025年台式机独立显卡出货量将达4428万张，英伟达占92%。尽管RTX 50系列显卡因性能强大而受欢迎，但因内存短缺价格高企，开发者和小企业需求增...
硅基造物主：AI 如何终结爱迪生式的科学，直接“逆推”物理世界
文章探讨了人工智能在材料科学中的重大影响，强调其通过“逆向设计”提高材料创造效率，改变了我们对物质的理解，推动科学与哲学的变革。
OpenClaw创始人建议用户不要使用小模型跑高风险任务因为提示词注入防护非常弱
OpenClaw创始人建议用户避免在高风险任务中使用小模型或旧模型，因为这些模型的提示词注入防护较弱，存在安全隐患。用户应选择最新、指令对齐更强的模型，并...

手术刀式去噪突破LLM能力上限，从头预训练模型下游任务平均提高7.2% | 中科院＆阿里

内容提要

关键要点

标签

继续阅读