Apple Machine Learning Research ·

为语音识别启用差分隐私的联邦学习：基准测试、自适应优化器与梯度裁剪

💡 原文英文，约300词，阅读约需2分钟。

📝

内容提要

联邦学习（FL）与差分隐私（DP）在自动语音识别（ASR）中的应用尚待深入。本文通过逐层裁剪和梯度归一化技术，缓解了大模型在FL中面临的梯度异质性问题。实验结果表明，在强隐私保护下，FL与DP在用户规模达到数百万时是可行的，并且在不同规模下的字错误率有所改善。这为大模型的隐私保护FL算法设计提供了指导。

🎯

关键要点

联邦学习（FL）和差分隐私（DP）在自动语音识别（ASR）中的应用尚未深入研究。
大模型在FL中面临梯度异质性问题，导致标准优化技术难以收敛。
本文建立了FL与DP在端到端ASR中的第一个基准。
采用逐层裁剪和梯度归一化技术来缓解大模型中的剪切偏差和梯度异质性。
实验结果表明，在强隐私保护下，FL与DP在用户规模达到数百万时是可行的。
在高人口规模下，字错误率下降1.3%；在低人口规模下，字错误率下降4.6%。
研究揭示的梯度异质性和逐层梯度归一化的原则为大模型的隐私保护FL算法设计提供了指导。

❓

延伸问答

联邦学习和差分隐私在自动语音识别中的应用有哪些挑战？

主要挑战是大模型在联邦学习中面临的梯度异质性问题，这使得标准优化技术难以收敛。

本文提出了什么方法来解决大模型的梯度异质性问题？

本文采用逐层裁剪和梯度归一化技术来缓解大模型中的剪切偏差和梯度异质性。

在强隐私保护下，联邦学习与差分隐私的可行性如何？

在用户规模达到数百万时，联邦学习与差分隐私是可行的，并且在不同规模下的字错误率有所改善。

实验结果显示在不同人口规模下字错误率的变化如何？

在高人口规模下，字错误率下降1.3%；在低人口规模下，字错误率下降4.6%。

本文建立了什么基准？

本文建立了联邦学习与差分隐私在端到端自动语音识别中的第一个基准。

研究揭示的原则对算法设计有什么指导意义？

研究揭示的梯度异质性和逐层梯度归一化的原则为大模型的隐私保护联邦学习算法设计提供了指导。

🏷️