小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究评估了越狱攻击对大型语言模型的影响,发现越狱输出普遍降低了模型的效用,并提出了“越狱税”概念,强调了AI安全性的重要性。

Jailbreak Tax: How Useful Are Your Jailbreak Outputs?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究探讨了差分隐私联邦学习中隐私保护与模型效用的平衡,提出了一种自适应剪辑机制,通过多目标优化动态调整剪辑标准,以提高模型准确性。实验证明,该方法在相同隐私约束下显著提升了模型性能。

Multi-Objective Optimization for Privacy-Utility Balance in Differentially Private Federated Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究探讨了视觉自回归(VAR)变换器的基本极限,表明单头VAR变换器在图像生成方面具有通用性,并提出了提高模型效用的重要设计原则。VAR变换器在图像生成中表现优异,超越了以往所有方法。

Universal Approximation of Visual Autoregressive Transformers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究提出了一种新方法,解决联邦学习中的梯度重建攻击引发的数据泄露问题。通过推导重建误差下界,并结合噪声添加和梯度剪枝策略,优化了数据泄露与模型效用之间的平衡。实验结果表明,该方法有效保护训练数据并提升模型效用。

Optimized Defense Against Gradient Reconstruction Attacks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

该研究提出了一种新算法FedDistr,旨在解决联邦学习中客户端数据分布纠缠的问题。该算法通过稳定的扩散模型,仅需一轮通信即可实现与分布式系统相当的效率,显著提高了模型的效用和效率,同时确保数据隐私。

Disentangling Data Distribution in Federated Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本研究提出了多种隐私保护生成模型的方法,包括私有教师集成(PATE)和基于差分隐私的生成模型,旨在优化训练过程和数据生成,以确保数据隐私并提升模型效用。研究表明,这些方法在实际应用中有效提高了隐私保护和生成数据的质量。

通过判别生成蒸馏学习隐私保护的学生网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本文介绍了多种针对推荐系统的机器遗忘方法,如RecEraser、IMCorrect和SRU,旨在提升用户隐私保护和模型效用。这些方法在处理敏感数据和提高推荐性能方面表现优越,强调了个性化与隐私之间的平衡,并探讨了未来的研究方向。

CURE4Rec:推荐系统遗忘评估的基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文提出了一种扩散模型的后门检测与清除框架,能够有效检测后门并降低其影响,同时保持模型的效用。研究展示了多种后门攻击方法及其防御机制,强调了对扩散模型滥用的审查和预防措施的必要性。

Diff-Cleanse:识别和减轻扩散模型中的后门攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

该研究提出了一种在线知识蒸馏的新方法,通过对比损失保证了参与者在不共享输入数据的情况下学习相似特征。该方法在多个数据集上进行了性能测试,相比独立学习和其他联邦知识蒸馏方案,提高了模型的效用。

利用模型压缩解决联合学习中的会员推导攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

该研究使用在线知识蒸馏方法,通过对比损失来学习相似特征。参与者的输入数据不需要共享,而是将特征表示发布到中央服务器。客户端使用对比目标来蒸馏知识,提高模型效用。该框架在多个数据集上进行了性能测试。

当 MiniBatch SGD 遇上 SplitFed Learning:收敛性分析与性能评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码