本研究评估了越狱攻击对大型语言模型的影响,发现越狱输出普遍降低了模型的效用,并提出了“越狱税”概念,强调了AI安全性的重要性。
本研究探讨了差分隐私联邦学习中隐私保护与模型效用的平衡,提出了一种自适应剪辑机制,通过多目标优化动态调整剪辑标准,以提高模型准确性。实验证明,该方法在相同隐私约束下显著提升了模型性能。
本研究探讨了视觉自回归(VAR)变换器的基本极限,表明单头VAR变换器在图像生成方面具有通用性,并提出了提高模型效用的重要设计原则。VAR变换器在图像生成中表现优异,超越了以往所有方法。
本研究提出了一种新方法,解决联邦学习中的梯度重建攻击引发的数据泄露问题。通过推导重建误差下界,并结合噪声添加和梯度剪枝策略,优化了数据泄露与模型效用之间的平衡。实验结果表明,该方法有效保护训练数据并提升模型效用。
该研究提出了一种新算法FedDistr,旨在解决联邦学习中客户端数据分布纠缠的问题。该算法通过稳定的扩散模型,仅需一轮通信即可实现与分布式系统相当的效率,显著提高了模型的效用和效率,同时确保数据隐私。
本研究提出了多种隐私保护生成模型的方法,包括私有教师集成(PATE)和基于差分隐私的生成模型,旨在优化训练过程和数据生成,以确保数据隐私并提升模型效用。研究表明,这些方法在实际应用中有效提高了隐私保护和生成数据的质量。
本文介绍了多种针对推荐系统的机器遗忘方法,如RecEraser、IMCorrect和SRU,旨在提升用户隐私保护和模型效用。这些方法在处理敏感数据和提高推荐性能方面表现优越,强调了个性化与隐私之间的平衡,并探讨了未来的研究方向。
本文提出了一种扩散模型的后门检测与清除框架,能够有效检测后门并降低其影响,同时保持模型的效用。研究展示了多种后门攻击方法及其防御机制,强调了对扩散模型滥用的审查和预防措施的必要性。
该研究提出了一种在线知识蒸馏的新方法,通过对比损失保证了参与者在不共享输入数据的情况下学习相似特征。该方法在多个数据集上进行了性能测试,相比独立学习和其他联邦知识蒸馏方案,提高了模型的效用。
该研究使用在线知识蒸馏方法,通过对比损失来学习相似特征。参与者的输入数据不需要共享,而是将特征表示发布到中央服务器。客户端使用对比目标来蒸馏知识,提高模型效用。该框架在多个数据集上进行了性能测试。
完成下面两步后,将自动完成登录并继续当前操作。