BriefGPT - AI 论文速递 ·

InstructRetro: 检索增强预训练后的指令调整

💡 原文中文，约500字，阅读约需2分钟。

📝

内容提要

该文介绍了一种名为Retro 48B的预先训练语言模型，通过从1.2万亿令牌中检索继续对43B GPT模型进行额外的1000亿令牌的预训练。Retro 48B在困惑度方面表现更好，InstructRetro在零样本问答任务上明显优于指导调整的GPT。

🎯

🏷️

Zed 1.0协议风波：你的代码被用来做训练数据
Zed 1.0协议引发了开发者对数据使用权和隐私的担忧。模糊的条款导致用户误解，认为自己的代码可能被滥用。AI补全功能需要访问用户代码，可能导致数据外流。...
Christophe Pettus: On pgvectorscale, and Hybrid Search Without an Elasticsearch Sidecar
pgvector is excellent. It is also, at large scale, expensive — because the HN...
保罗·梅尔基奥雷：Posette 2026
Posette 2026是一个免费的虚拟开发者活动，专注于PostgreSQL生成列的应用与演变。活动将通过实际案例探讨生成列的性能、存储和查询行为，并结...
OpenClaw v2026.4.29：群聊现在感觉好多了、记忆系统再进化
OpenClaw v2026.4.29版本改进了自动化对话、记忆系统和基础设施稳定性。新增的active-run引导和visible-reply机制增强了...
Roblox的日活跃用户持续下降，年龄检查减缓了增长
Roblox的日活跃用户在过去六个月减少了2000万，降至1.32亿，主要因实施年龄检查导致新用户增长放缓。尽管如此，Roblox的收入仍增长至14亿美元...
国会继续推迟监控改革
美国国会将《外国情报监视法》第702条延长45天，以便进行改革谈判。尽管有小幅改革，但未包含备受争议的搜查令要求，隐私倡导者对此表示失望。国会需在2026...