Apple Machine Learning Research ·

为语音识别启用差分隐私的联邦学习：基准测试、自适应优化器与梯度裁剪

💡 原文英文，约300词，阅读约需2分钟。

📝

内容提要

联邦学习（FL）与差分隐私（DP）在自动语音识别（ASR）中的应用尚待深入。本文通过逐层裁剪和梯度归一化技术，缓解了大模型在FL中面临的梯度异质性问题。实验结果表明，在强隐私保护下，FL与DP在用户规模达到数百万时是可行的，并且在不同规模下的字错误率有所改善。这为大模型的隐私保护FL算法设计提供了指导。

🎯

关键要点

联邦学习（FL）和差分隐私（DP）在自动语音识别（ASR）中的应用尚未深入研究。
大模型在FL中面临梯度异质性问题，导致标准优化技术难以收敛。
本文建立了FL与DP在端到端ASR中的第一个基准。
采用逐层裁剪和梯度归一化技术来缓解大模型中的剪切偏差和梯度异质性。
实验结果表明，在强隐私保护下，FL与DP在用户规模达到数百万时是可行的。
在高人口规模下，字错误率下降1.3%；在低人口规模下，字错误率下降4.6%。
研究揭示的梯度异质性和逐层梯度归一化的原则为大模型的隐私保护FL算法设计提供了指导。

🏷️

继续阅读

语言模型是商品吗？
近年来，语言模型的获取方式变得几乎免费，成为新兴商品。然而，可靠性、隐私保护和特定领域适应性仍是高端产品的特点，使得“商品”一词在语言模型中存在争议。
苹果智能家居显示器的传闻现在指向将在秋季发布，搭载iOS 27
传闻中的带屏幕HomePod原定于2025年发布，现已推迟至秋季。泄密者Kosutami和彭博社记者Mark Gurman确认，配备机器人手臂的版本计划在2027年发布。
政府停摆影响机场，但ICE不受影响
国土安全部因移民执法问题停摆四周，国会民主党要求白宫对ICE和CBP进行多项变更。尽管DHS受影响，ICE和CBP仍有充足资金。特朗普的OBBBA法案为这...
一切都在赌博中：过去一周的所有事情
Kalshi致力于吸引更多女性用户，过去十个月女性用户比例从13%提升至26%。联合创始人表示，此变化旨在迎合女性的兴趣和专业需求。
OpenAI和谷歌的员工支持Anthropic对五角大楼的诉讼
致命自主武器在新环境中表现不可靠，无法准确识别目标，缺乏人类判断能力，因此决策过程中需有人类参与以确保安全。
Bluesky首席执行官Jay Graber将辞职
Jay Graber于2021年成为Bluesky首任CEO，现转任首席创新官，Toni Schneider暂任CEO。Bluesky用户从3000万增至4000万。

为语音识别启用差分隐私的联邦学习：基准测试、自适应优化器与梯度裁剪

内容提要

关键要点

标签

继续阅读