小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章讨论了通过优化目标函数(LFD)高效开发产品的方法。作者指出传统目标设定方法的缺陷,强调盲测和迭代优化对提升模型性能的重要性。经过多轮测试,agent在不作弊的情况下显著提高了结果准确性。此外,信息不对称被认为是构建竞争优势的关键,建议开发者关注真实评估集和用户反馈,以加速产品迭代。

【译文】/goal + 损失函数:如何用一条指令在 30 小时内蒸馏一个产品

电波障害
电波障害 · 2026-06-11T04:00:00Z
高效的隐私损失核算:针对子采样和随机分配

本文探讨了一种在k个步骤中随机均匀使用用户数据的采样方案,该方案在差分隐私优化和高维私有聚合中表现出优于标准泊松采样的效用。研究表明,随机分配的隐私损失分布可以高效计算,并且在训练DP-SGD时,其隐私效用权衡至少与泊松子采样相当。此外,本文开发了新的隐私损失核算工具,扩展了对子采样的准确核算。

高效的隐私损失核算:针对子采样和随机分配

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-13T00:00:00Z
LaCy:小型语言模型可以和应该学习的内容不仅仅是损失问题

本文探讨了小型语言模型(SLMs)在预训练过程中应学习的标记及何时通过<CALL>标记请求外部帮助。研究表明,损失值可以预测标记的准确性,但某些高损失标记仍可接受。提出的LaCy方法通过选择性学习和委托,显著提高了生成的准确性和效率。

LaCy:小型语言模型可以和应该学习的内容不仅仅是损失问题

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-09T00:00:00Z
为什么大模型的损失函数是交叉熵

大模型的损失函数主要是交叉熵,它通过概率和信息理论衡量模型输出与真实结果的差距。模型的目标是预测下一个token,损失函数通过负对数似然最小化错误概率。交叉熵量化模型分布与真实分布的一致性,反映生成文本的准确性。

为什么大模型的损失函数是交叉熵

木鸟杂记
木鸟杂记 · 2026-03-29T07:31:35Z
大模型的损失函数为什么是交叉熵

大模型的损失函数主要是交叉熵,通过量化模型输出与预期的差距来评估性能。交叉熵与负对数似然(NLL)密切相关,都是衡量预测准确性的工具。训练目标是最小化损失值,以提高预测准确性。交叉熵从信息论角度评估模型分布与真实分布的一致性,确保模型能准确预测下一个词元。

大模型的损失函数为什么是交叉熵

木鸟杂记
木鸟杂记 · 2026-03-29T07:31:35Z
Meta的法律败诉可能是儿童的胜利,也可能是所有人的损失

美国陪审团裁定Meta和YouTube对未成年人造成伤害,判决其承担数亿赔偿责任。这一判决可能促使社交媒体平台改变商业模式,并可能对青少年使用社交媒体施加限制,影响边缘群体的连接。

Meta的法律败诉可能是儿童的胜利,也可能是所有人的损失

The Verge
The Verge · 2026-03-28T14:00:00Z
早报|苹果发布iPhone 17e,4499起支持eSIM/vivo X300 Ultra将搭载双2亿像素三摄/豆瓣回应运营失误商品被薅空:无法承受损失

苹果发布iPhone 17e和M4 iPad Air,起售价4499元。小米机器人在汽车工厂完成自主作业测试,成功率达到90.2%。vivo X300 Ultra在MWC展出,配备双2亿像素三摄。小鹏推出第二代VLA,提升智能驾驶体验。理想汽车发布软硬协同设计定律,推动智能驾驶芯片研发。

早报|苹果发布iPhone 17e,4499起支持eSIM/vivo X300 Ultra将搭载双2亿像素三摄/豆瓣回应运营失误商品被薅空:无法承受损失

爱范儿
爱范儿 · 2026-03-03T00:00:58Z
豆瓣运营错发满200减200优惠券 公告称因无力承担损失将强制取消订单

豆瓣因运营失误将满200减20的优惠券错误设置为满200减200,导致用户大量抢购,商品迅速售罄。豆瓣决定强制退款并发放20元红包作为补偿,表示无法承受损失。

豆瓣运营错发满200减200优惠券 公告称因无力承担损失将强制取消订单

蓝点网
蓝点网 · 2026-03-02T09:58:49Z
每日沙雕大赛?有人向OpenClaw控制的加密账户乞讨 结果收到5.6万美元打赏

OpenClaw AI 机器人因内部崩溃,误转出5243万代币,损失约5.6万美元,未能识别乞讨者诈骗。事件引发关注,代币交易量上升,钱包余额回升至30万美元。

每日沙雕大赛?有人向OpenClaw控制的加密账户乞讨 结果收到5.6万美元打赏

蓝点网
蓝点网 · 2026-02-24T01:00:26Z
斯特兰蒂斯正面临自我制造的危机

斯特兰蒂斯因电动车需求骤降面临260亿美元损失,股价暴跌25%。公司未能跟上技术和消费者偏好,仍依赖SUV和卡车。尽管计划推出新车型,但需加大电气化投资以应对未来竞争。

斯特兰蒂斯正面临自我制造的危机

The Verge
The Verge · 2026-02-21T13:00:00Z

美国人抱怨房价高,但房价下跌会导致房主,尤其是有按揭者,遭受损失。这将加剧住房可负担性危机,影响人们的资产持有。

住房成本

the singularity is nearer
the singularity is nearer · 2026-02-15T16:00:00Z

韩国交易所Bithumb因操作失误向695名用户误发2,000枚比特币,已自购1,788枚补充库存,平台承担所有损失并确保受影响用户获得补偿。

Bithumb更新误发60万枚比特币后续:已自购被用户出售的1,788枚比特币补充余额

蓝点网
蓝点网 · 2026-02-09T07:05:14Z

韩国加密货币交易所Bithumb因内部失误向635名用户空投2000个比特币,造成1.3亿美元损失。已卖出比特币的用户无需退还,未卖出的将被冻结。事件导致比特币价格瞬间暴跌20%,但随后恢复。Bithumb确认资产安全,交易已恢复正常。

泼天富贵!韩国交易所Bithumb失误向用户空投2,000比特币 已卖出将不需要退款

蓝点网
蓝点网 · 2026-02-07T03:22:49Z
被解雇的游戏公司CEO,把工作室域名劫持拍卖了

北美游戏工作室That's No Moon的前CEO蒙鲍尔在被解雇5年后劫持了工作室域名,导致团队邮箱无法使用,并将网站重定向到旅游页面和域名拍卖网站,索价6666666美元,造成TNM损失超100万美元,显示出双方积怨已久。

被解雇的游戏公司CEO,把工作室域名劫持拍卖了

游戏研究社
游戏研究社 · 2026-01-28T16:00:00Z
币安旗下加密钱包Trust Wallet更新安全事件:将赔付850万美元 攻击源头是NPM供应链攻击

币安的Trust Wallet遭遇NPM供应链攻击,黑客通过后门版本窃取用户助记词,损失达850万美元。受影响用户将获得全额赔偿。

币安旗下加密钱包Trust Wallet更新安全事件:将赔付850万美元 攻击源头是NPM供应链攻击

蓝点网
蓝点网 · 2025-12-31T03:23:25Z

本文探讨了SGD的收敛性质,特别是终点损失与理论最优值的关系。通过理论推导,证明了训练结束时权重与最优值的接近程度,并强调了平均损失收敛与终点损失收敛的相似性,为训练实践提供了理论支持。

让炼丹更科学一些(三):SGD的终点损失收敛

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-12-16T02:25:00Z
韩国加密货币交易所UPBIT遭到黑客攻击 约3.69亿美元的代币被转移到未知钱包

韩国最大加密货币交易所UPBIT遭黑客攻击,损失约540亿韩元(约3.69亿美元)。UPBIT已冻结120亿韩元代币,承诺用户资产安全,并将在清查后恢复提现。交易所正与警方合作追查黑客。

韩国加密货币交易所UPBIT遭到黑客攻击 约3.69亿美元的代币被转移到未知钱包

蓝点网
蓝点网 · 2025-11-27T05:30:00Z
FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP

本文讨论了流策略优化(FPO)在强化学习中的应用,强调其通过条件流匹配损失替代传统高斯似然损失,从而提高策略表达能力。FPO有效处理多峰决策问题,适用于复杂任务,如机器人控制,并通过优化证据下界(ELBO)简化计算过程,提升学习效率。

FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP

结构之法 算法之道
结构之法 算法之道 · 2025-11-25T09:59:55Z
迪士尼因YouTube TV停播每天损失超过400万美元的收入

迪士尼与谷歌的YouTube TV因新内容分发合同争执,导致每天损失430万美元,已持续12天。分析师预计本周内将达成解决方案。谷歌指责迪士尼的行为是谈判策略,而迪士尼则指责谷歌拒绝支付合理费用。

迪士尼因YouTube TV停播每天损失超过400万美元的收入

The Verge
The Verge · 2025-11-11T19:28:19Z
LinEAS:基于分布损失的激活引导端到端学习

LinEAS是一种新方法,通过全局损失训练激活引导,旨在控制生成模型的输出,减少有害内容。该方法仅需少量无配对样本,在语言模型的毒性缓解上表现优于传统方法,具有更强的鲁棒性和有效性。

LinEAS:基于分布损失的激活引导端到端学习

Apple Machine Learning Research
Apple Machine Learning Research · 2025-11-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码