小红花·文摘

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了

机器之心 ·

谷歌推出的5门MLOps课程，提升你的机器学习工作流程

KDnuggets ·

本文介绍了一种名为“双梯度投影”的方法，用于解决机器学习系统在学习新任务时容易忘记先前的对抗鲁棒性的问题。该方法通过将权重更新的梯度正交投影到两个关键子空间上，实现连续鲁棒学习。实验结果表明，该方法有效地保持了连续鲁棒性，并对抗强对抗攻击的效果优于其他方法。

鲁棒性一致的对抗训练用于安全机器学习模型更新

BriefGPT - AI 论文速递 ·

本文介绍了证据深度学习的新理论洞见，探讨了优化二阶损失函数和解释认知性不确定度度量的困难。通过实验，提供了对二阶损失最小化和认知不确定性度量的新见解。

证据深度学习方法是否能真实地表示认知不确定性？

BriefGPT - AI 论文速递 ·

最小贝叶斯风险（MBR）解码是一种选择机器学习系统输出的方法，基于多个候选项中具有最低风险的输出。本文介绍了该方法和最近的文献，证明了一些最近的方法可以被写成 MBR 的特例，并给出了在 NLP 模型中应用 MBR 的理论和实证结果，包括该领域的未来方向的具体建议。

线性时间最小贝叶斯风险解码与参考汇聚

BriefGPT - AI 论文速递 ·

高数据质量对机器学习系统和大数据的影响越来越重要。欧洲委员会提出的AI法案特别关注安全相关的机器学习系统的市场引入，并定义了具有挑战性的数据质量法律要求。本文介绍了一种新的方法，支持多种数据质量方面的数据质量保证过程，并通过示例数据集和MNIST数据集的应用演示了该方法的好处。

时间序列数据的信号质量审计

BriefGPT - AI 论文速递 ·

在大模型时代的浪潮中，机器学习系统正经历着前所未有的变革。大模型在训练和部署上面临挑战，但也带来了新的机遇。云端部署目前更为主流，国产芯片在推理领域发展和挑战值得关注。大模型的部署仍有发展空间。

活动回顾 (下) | 机器学习系统趋势研判，大咖金句汇总

HyperAI超神经 ·

该文章讨论了机器学习系统中数据毒化攻击的问题，并提出了一种防御方法。该方法在MNIST-1-7和Dogfish数据集上表现出较强的防御能力，但在IMDB情感数据集上添加3%的毒化数据会导致测试误差上升至23%。

数据炼金术：通过扩散模型净化中毒数据集以缓解后门攻击

BriefGPT - AI 论文速递 ·

本文研究了机器学习系统中的信息流控制，利用元数据确保隐私和机密性。通过比较微调模型和检索增强模型，证明检索增强架构具有最佳效用、可扩展性和灵活性。

从信息流控制的角度重新思考机器学习管道中的隐私

BriefGPT - AI 论文速递 ·

本文介绍了一种基于自适应浓度不等式的可扩展算法，用于验证机器学习系统在进行社会决策时是否会对少数族裔造成不公平待遇，并在一个名为 VeriFair 的工具中实现了这个算法。该算法能够扩展到大的机器学习模型，包括一个比先前已验证过的神经网络大五个数量级的深度循环神经网络。虽然该技术只提供概率保证，但可以选择非常小的误差概率。

分布式个体公平性认证

BriefGPT - AI 论文速递 ·

该文章讨论了对使用用户数据训练的机器学习系统进行数据毒化攻击的问题，并提出了一种防御方法。该方法在MNIST-1-7和Dogfish数据集上表现出较强的防御能力，但在IMDB情感数据集上加入3%的毒化数据会导致测试误差从12%提升至23%。

理解亚群体对中毒攻击的敏感性变异

BriefGPT - AI 论文速递 ·

本文介绍了一种通过多元宇宙分析方法将隐含的设计决策转化为明确的决策，并展示其公平性影响的方法。研究结果展示了机器学习系统设计中的决策对公平性的影响，并介绍了如何使用多元宇宙分析来检测这些影响。

搜索引擎的索引和搜索易受文本编码攻击，攻击者使用不常见的编码形式扰动文本，操纵搜索结果。这种攻击适用于商业搜索引擎和开源搜索引擎，以及聊天搜索和文本摘要总结。攻击者可以误导用户，推动虚假信息传播。攻击还可限制对文本文件的搜索能力。攻击者通过隐藏和呈现恶意内容来操纵搜索引擎。攻击影响商业搜索引擎和机器学习系统。实验评估了不同搜索引擎和攻击技术的影响。攻击者可以通过扰动查询结果，插入虚假信息。评估使用破坏性、隐藏性和呈现性指标。实验针对Google、Bing和Elasticsearch进行。攻击包括不可见字符、同形字、重新排序和删除。

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了

谷歌推出的5门MLOps课程，提升你的机器学习工作流程

鲁棒性一致的对抗训练用于安全机器学习模型更新

证据深度学习方法是否能真实地表示认知不确定性？

线性时间最小贝叶斯风险解码与参考汇聚

时间序列数据的信号质量审计

活动回顾 (下) | 机器学习系统趋势研判，大咖金句汇总

数据炼金术：通过扩散模型净化中毒数据集以缓解后门攻击

从信息流控制的角度重新思考机器学习管道中的隐私

分布式个体公平性认证

理解亚群体对中毒攻击的敏感性变异

使用多元宇宙分析评估模型设计决策对算法公平性的影响

针对搜索引擎的编码扰动攻击

增强抗毒能力：针对中毒攻击的改进点对点认证

字节跳动基于 Hudi 的机器学习应用场景