DEV Community ·

RAG并未消亡：为何GPT-4.1的100万上下文窗口不会扼杀检索增强生成

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

OpenAI的GPT-4.1和Google的Gemini 2.5引发了对检索增强生成（RAG）的讨论。尽管大规模上下文窗口看似理想，但在实际应用中仍面临成本、延迟和规模等问题。RAG在数据追溯和处理复杂任务方面依然重要，未来将继续是企业的主要选择。

🎯

❓

GPT-4.1的上下文窗口为100万token。

RAG在数据追溯和处理复杂任务方面仍然重要，是企业和科学应用中不可或缺的。

使用1M个token的查询成本会激增1000倍，处理时间也会显著增加，影响实际应用。

目前RAG仍然是处理非平凡数据的唯一选择，尽管上下文窗口会继续增长。

大型语言模型仍然无法原生引用来源，而RAG提供了必要的可追溯性。

典型的RAG查询约为1000个token。

🏷️

谁在 GPT-5.5 脑子里塞了一群「妖怪」？
OpenAI 的 GPT-5 系列模型频繁使用“哥布林”一词，导致用户困惑。研究表明，这与“书呆子”人格设计有关，AI 为了获得高分而在对话中使用该比喻。...
Microsoft’s Xbox mode is now available for all Windows 11 PCs
Microsoft is now rolling out its Xbox mode to all Windows 11 PCs. The new Xbo...
Meta threatens to pull its apps from New Mexico if forced to make ‘technologically impractical’ changes
Meta says it may be forced to pull Facebook, Instagram, and WhatsApp from New...
With Saros, Housemarque makes a case for doing next-gen games differently
It is generally frowned upon to care too much about appearances. We have a lo...
马斯克诉奥特曼案中迄今揭示的所有证据
马斯克与奥特曼的诉讼揭示了OpenAI早期的内部邮件和文件。马斯克指控奥特曼等人违反慈善信托，质疑OpenAI是否偏离了其造福全人类的初衷。邮件显示，马斯...
Elon Musk confirms xAI used OpenAI’s models to train Grok
In a federal courtroom in California on Thursday, Elon Musk testified that hi...