小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
减少灌输以容纳更多:训练数据修剪提升事实记忆能力

本文探讨了大语言模型(LLMs)在记忆事实知识方面的挑战,并提出通过训练数据修剪来提高事实准确性。研究表明,当训练数据中的信息量超过模型容量时,事实准确性会下降。作者提出了一种基于训练损失的数据选择方案,能够有效提升模型的事实记忆能力,甚至使小模型的表现接近大模型。

减少灌输以容纳更多:训练数据修剪提升事实记忆能力

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-13T00:00:00Z

自2006年推出Amazon S3以来,亚马逊云科技经历了20年的发展,深刻影响了云服务行业。其技术和商业模式不断创新,支持了包括NASA在内的众多客户和项目。当前,亚马逊云科技的实例数量已超过3.9亿,成为全球云服务的重要参与者。

亚马逊云科技背后鲜为人知的事实

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-03T02:11:37Z
SafetyPairs:通过反事实图像生成隔离安全关键图像特征

本文介绍了SafetyPairs框架,生成仅在安全特征上不同的图像对,以区分安全与不安全的图像。通过图像编辑模型进行针对性修改,构建了一个包含3020个图像的安全基准,提升了视觉语言模型的评估能力,并改善了轻量级模型的训练效率。

SafetyPairs:通过反事实图像生成隔离安全关键图像特征

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-24T00:00:00Z

文章讨论了中美地缘政治竞争,指出中国经济迅速崛起超出西方预期,打破修昔底德陷阱。特朗普政府的关税政策未能奏效,反而助力中国在关键技术领域进步。未来,美国可能更关注巩固美洲防御,而非直接对抗中国。

2026年地缘政治,与《从事实中寻求真相》播客的交叉 - 第103期

Josherich的博客
Josherich的博客 · 2026-01-15T00:00:01Z
发布FACTS基准套件以评估大型语言模型的事实准确性

FACTS基准套件发布,旨在系统评估大型语言模型的事实准确性。该套件由FACTS团队与Kaggle合作开发,扩展了事实基础评估,新增参数、搜索和多模态三个基准,共包含3513个示例,评估模型在不同场景下的准确性。Gemini 3 Pro模型得分最高,但整体准确率未超过70%。该基准旨在支持研究,提供共享的事实可靠性参考。

发布FACTS基准套件以评估大型语言模型的事实准确性

InfoQ
InfoQ · 2026-01-12T07:55:00Z
为什么情感比事实更重要

情感在决策中比事实更重要。研究表明,情感反应比逻辑分析更迅速,影响我们的选择。情感记忆比数字信息更持久,强烈的情感体验能增强记忆形成。品牌通过激发情感来提高客户忠诚度,情感体验在生活中占据重要地位。

为什么情感比事实更重要

Business Review at Berkeley
Business Review at Berkeley · 2025-12-29T18:04:45Z
为什么情感比事实更重要

情感在决策中比事实更重要。研究表明,情感反应比理性分析更快,且情感记忆比数字信息更持久。市场营销中广泛应用情感驱动的体验,品牌通过激发积极情感来增强消费者的记忆和忠诚度。

为什么情感比事实更重要

Business Review at Berkeley
Business Review at Berkeley · 2025-12-29T18:03:39Z
为什么情感比事实更重要

情感在决策中比事实更重要。研究表明,情感反应比理性思考更迅速,且情感记忆更持久,能增强信息的记忆效果。商家通过激发消费者的情感来提升品牌忠诚度。

为什么情感比事实更重要

Business Review at Berkeley
Business Review at Berkeley · 2025-12-29T17:49:42Z
为什么情感比事实更重要

情感在决策中比事实更重要。研究表明,情感反应比理性思考更迅速,能瞬间影响行为。情感记忆比数据更持久,强烈的情感体验能增强记忆。企业通过激发客户情感来提升品牌忠诚度。

为什么情感比事实更重要

Business Review at Berkeley
Business Review at Berkeley · 2025-12-29T16:18:48Z
Training-Time RTC——在训练时模拟推理延迟(承认既定事实专心预测后续动作):消除推理阶段的计算开销,让π0.6完成箱子装配与咖啡制作

自2023年大模型兴起以来,博客影响力迅速增长,吸引了国内外博士生的关注。PI公司提出的训练时实时分块(training-time RTC)方法,通过模拟推理延迟,显著降低计算成本并提升机器人任务执行性能。该方法无需修改模型架构,仅需少量代码实现,已在实际任务中验证有效性。

Training-Time RTC——在训练时模拟推理延迟(承认既定事实专心预测后续动作):消除推理阶段的计算开销,让π0.6完成箱子装配与咖啡制作

结构之法 算法之道
结构之法 算法之道 · 2025-12-13T14:52:40Z

大型语言模型(LLMs)在信息传递中日益重要,回答的准确性至关重要。为此,我们推出了FACTS基准套件,包含多个模型的事实准确性测试,包括参数基准、搜索基准和多模态基准。Kaggle将管理该套件,并提供3513个示例供公开使用。

FACTS基准套件:系统评估大型语言模型的事实准确性

Google DeepMind Blog
Google DeepMind Blog · 2025-12-09T11:29:03Z
Grokipedia.com 上线,真相战争打响!马斯克炮轰维基百科“左派偏见”后亲自下场,用AI重塑知识版图,谁将定义事实?|Grokipedia、Elon Musk、Wikipedia、AI

马斯克推出的Grokipedia网站上线后遭遇崩溃、抄袭和事实错误等问题。与维基百科不同,Grokipedia的内容由AI生成,缺乏透明性和去中心化,存在意识形态偏差。马斯克希望通过此平台建立自己的“事实基准”,未来可能出现更多类似的“主权百科”。

Grokipedia.com 上线,真相战争打响!马斯克炮轰维基百科“左派偏见”后亲自下场,用AI重塑知识版图,谁将定义事实?|Grokipedia、Elon Musk、Wikipedia、AI

硕鼠的博客站
硕鼠的博客站 · 2025-10-30T00:42:27Z
TikTok视频即将获得众包事实检查

TikTok推出了“脚注”功能,允许用户为视频添加社区事实检查和额外上下文。该功能将在未来几周内向美国用户推出,已有近80,000名用户成为贡献者。此系统旨在通过不同观点达成共识,类似于其他社交平台的社区笔记功能。

TikTok视频即将获得众包事实检查

The Verge
The Verge · 2025-07-30T13:31:33Z
美国司法部为事实核查的法律战争铺平道路

美国司法部在一起反垄断诉讼中指出,新闻机构与科技平台合作标记虚假信息可能违反反垄断法。儿童健康防卫组织控告《华盛顿邮报》等媒体,称其因内容被降级和限制而损失收入。政府认为,维护信息质量的竞争是反垄断法的重要内容。

美国司法部为事实核查的法律战争铺平道路

The Verge
The Verge · 2025-07-11T19:29:51Z

生活中,理论与事实常常不符。婚礼誓言美好,但难以长久遵守;工作中的担当可能导致不公。理解这一点有助于我们更好地面对生活的选择与结果。

理论正确,事实错误

二丫讲梵
二丫讲梵 · 2025-06-21T18:14:28Z

本研究针对大语言模型在复杂开放领域问答场景中的推理能力进行深入分析,解决了推理链长度对事实准确性的影响尚不明确的问题。通过引入知识图谱的信息并扩展推理链,本研究发现小型推理模型在事实准确性上有明显提升,并且增加计算及令牌预算时准确性进一步提高2-8%。

扩展推理能够提升大语言模型的事实准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

本研究旨在解决当前对顾客旅程缺乏定量分析的问题。通过提出一种新方法,包括定义序列数据的距离、预测购买可能性以及推荐反事实序列,本研究揭示了顾客旅程中的典型序列和关键购买环节。研究结果表明,该方法能够显著支持市场营销活动的改进。

使用原型检测和反事实解释分析顾客旅程的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

本研究针对自然语言与几何形状结合中的对象引用识别问题,提出了一种新方法,通过生成反事实示例来回答模型为何错误预测的疑问。研究发现,这种方法能够揭示描述中的缺陷和模型的偏见,从而帮助工程师改善模型,提升系统的互动体验。

你为什么错了?3D物体语言基础的反事实解释

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-09T00:00:00Z
我没想到人工智能会如此迅速地改变SaaS(但事实就是如此)

到2025年,人工智能不仅提升了SaaS,还重新定义了其运作方式。自动化成为基础,AI处理繁琐的手动任务,使团队能够专注于实际问题。用户体验显著改善,AI实时学习用户行为并调整应用,预测功能成为核心,智能SaaS工具变得更加主动,为用户提供竞争优势。

我没想到人工智能会如此迅速地改变SaaS(但事实就是如此)

DEV Community
DEV Community · 2025-05-07T19:01:31Z
Dr. Headline – 自主AI代理发布每日事实政治新闻简报

Dr. Headline是一个自主AI代理,专注于撰写和发布中立的政治新闻简报。自2025年上线以来,每天发布两篇经过多重评估的信息,确保准确性。该项目由独立爱好者发起,欢迎合作与反馈。

Dr. Headline – 自主AI代理发布每日事实政治新闻简报

DEV Community
DEV Community · 2025-04-29T22:56:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码