小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了

随着机器学习系统在重要领域的应用增加,对其输出的信任变得越来越重要。OpenAI的研究表明,通过让大型语言模型生成易于理解的文本,可以提高其可读性和可信度。他们采用了一种名为'Prover-Verifier Games'的博弈论框架,让强大的模型(证明者)和较弱的模型(验证者)相互博弈,以达到平衡。通过这种训练方法,模型的性能和可读性都得到了提升。这种方法对于需要精确沟通的领域非常有益。然而,这项研究来自OpenAI的超级对齐团队,该团队已经解散。

OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了

机器之心
机器之心 · 2024-07-18T06:36:55Z
谷歌推出的5门MLOps课程,提升你的机器学习工作流程

谷歌提供MLOps课程,帮助学习构建和部署机器学习系统,涵盖生产机器学习系统、机器学习运维、使用Vertex AI平台等内容。学习课程可掌握使用Vertex AI构建和部署机器学习解决方案的技能。

谷歌推出的5门MLOps课程,提升你的机器学习工作流程

KDnuggets
KDnuggets · 2024-04-30T14:00:31Z

本文介绍了一种名为“双梯度投影”的方法,用于解决机器学习系统在学习新任务时容易忘记先前的对抗鲁棒性的问题。该方法通过将权重更新的梯度正交投影到两个关键子空间上,实现连续鲁棒学习。实验结果表明,该方法有效地保持了连续鲁棒性,并对抗强对抗攻击的效果优于其他方法。

鲁棒性一致的对抗训练用于安全机器学习模型更新

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

本文介绍了证据深度学习的新理论洞见,探讨了优化二阶损失函数和解释认知性不确定度度量的困难。通过实验,提供了对二阶损失最小化和认知不确定性度量的新见解。

证据深度学习方法是否能真实地表示认知不确定性?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z

最小贝叶斯风险(MBR)解码是一种选择机器学习系统输出的方法,基于多个候选项中具有最低风险的输出。本文介绍了该方法和最近的文献,证明了一些最近的方法可以被写成 MBR 的特例,并给出了在 NLP 模型中应用 MBR 的理论和实证结果,包括该领域的未来方向的具体建议。

线性时间最小贝叶斯风险解码与参考汇聚

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-06T00:00:00Z

高数据质量对机器学习系统和大数据的影响越来越重要。欧洲委员会提出的AI法案特别关注安全相关的机器学习系统的市场引入,并定义了具有挑战性的数据质量法律要求。本文介绍了一种新的方法,支持多种数据质量方面的数据质量保证过程,并通过示例数据集和MNIST数据集的应用演示了该方法的好处。

时间序列数据的信号质量审计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-01T00:00:00Z

在大模型时代的浪潮中,机器学习系统正经历着前所未有的变革。大模型在训练和部署上面临挑战,但也带来了新的机遇。云端部署目前更为主流,国产芯片在推理领域发展和挑战值得关注。大模型的部署仍有发展空间。

活动回顾 (下) | 机器学习系统趋势研判,大咖金句汇总

HyperAI超神经
HyperAI超神经 · 2023-12-28T11:32:11Z

该文章讨论了机器学习系统中数据毒化攻击的问题,并提出了一种防御方法。该方法在MNIST-1-7和Dogfish数据集上表现出较强的防御能力,但在IMDB情感数据集上添加3%的毒化数据会导致测试误差上升至23%。

数据炼金术:通过扩散模型净化中毒数据集以缓解后门攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-18T00:00:00Z

本文研究了机器学习系统中的信息流控制,利用元数据确保隐私和机密性。通过比较微调模型和检索增强模型,证明检索增强架构具有最佳效用、可扩展性和灵活性。

从信息流控制的角度重新思考机器学习管道中的隐私

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

本文介绍了一种基于自适应浓度不等式的可扩展算法,用于验证机器学习系统在进行社会决策时是否会对少数族裔造成不公平待遇,并在一个名为 VeriFair 的工具中实现了这个算法。该算法能够扩展到大的机器学习模型,包括一个比先前已验证过的神经网络大五个数量级的深度循环神经网络。虽然该技术只提供概率保证,但可以选择非常小的误差概率。

分布式个体公平性认证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-20T00:00:00Z

该文章讨论了对使用用户数据训练的机器学习系统进行数据毒化攻击的问题,并提出了一种防御方法。该方法在MNIST-1-7和Dogfish数据集上表现出较强的防御能力,但在IMDB情感数据集上加入3%的毒化数据会导致测试误差从12%提升至23%。

理解亚群体对中毒攻击的敏感性变异

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-20T00:00:00Z

本文介绍了一种通过多元宇宙分析方法将隐含的设计决策转化为明确的决策,并展示其公平性影响的方法。研究结果展示了机器学习系统设计中的决策对公平性的影响,并介绍了如何使用多元宇宙分析来检测这些影响。

使用多元宇宙分析评估模型设计决策对算法公平性的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-31T00:00:00Z

搜索引擎的索引和搜索易受文本编码攻击,攻击者使用不常见的编码形式扰动文本,操纵搜索结果。这种攻击适用于商业搜索引擎和开源搜索引擎,以及聊天搜索和文本摘要总结。攻击者可以误导用户,推动虚假信息传播。攻击还可限制对文本文件的搜索能力。攻击者通过隐藏和呈现恶意内容来操纵搜索引擎。攻击影响商业搜索引擎和机器学习系统。实验评估了不同搜索引擎和攻击技术的影响。攻击者可以通过扰动查询结果,插入虚假信息。评估使用破坏性、隐藏性和呈现性指标。实验针对Google、Bing和Elasticsearch进行。攻击包括不可见字符、同形字、重新排序和删除。

针对搜索引擎的编码扰动攻击

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2023-08-24T03:00:31Z

本文讨论了机器学习系统中数据毒化攻击的问题,并提出了一种防御方法。该方法在MNIST-1-7和Dogfish数据集上表现出较强的防御能力,但在IMDB情感数据集上,添加3%的毒化数据会导致测试误差从12%提升至23%。

增强抗毒能力:针对中毒攻击的改进点对点认证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-15T00:00:00Z

本文介绍了火山引擎LAS团队自研的多场景样本离线存储技术,用于处理机器学习系统的离线数据流。文章揭秘了流批一体样本生成的过程,并分享了对Hudi内核的优化和改造,以及在数据处理领域的实际应用和效果。同时,还有新人优惠购福利等着读者。

字节跳动基于 Hudi 的机器学习应用场景

字节跳动技术团队官方博客
字节跳动技术团队官方博客 · 2023-07-20T04:06:55Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码