量子位 ·

1万tokens是检验长文本的新基准，超过后18款大模型集体失智

💡 原文中文，约3600字，阅读约需9分钟。

📝

内容提要

研究发现，长文本输入（超过1万tokens）会显著降低大型语言模型（LLM）的性能，准确率从90%降至50%。不同模型在处理长文本时表现差异，输入内容的语义特征和结构也会影响性能衰减。实验揭示了模型在长上下文任务中的局限性，建议优化指令和保存上下文以提升性能。

🎯

❓

长文本输入超过1万tokens会显著降低大型语言模型的性能，准确率从90%降至50%。

不同模型在处理长文本时表现差异，性能下降的节点不同，例如Claude在1000tokens后准确率下滑，而GPT-4.1可能在第10页就失智。

输入长度是性能衰减的核心变量，语义关联性和干扰信息会加剧性能下降，且不同模型对这些因素的敏感程度存在差异。

建议给出明确、清晰的指令，并在收集到足够的信息后保存上下文，以提升模型在长文本任务中的性能。

实验设计了四项对照实验，验证了输入长度、语义相似度和干扰信息对模型性能的影响。

干草堆的结构模式对模型性能有显著影响，连贯结构下性能下降更明显，而打乱结构下性能下降较缓和。

🏷️

零样本文本分类入门
零样本文本分类是一种无需特定任务训练数据即可标记文本的方法。模型通过将标签转化为自然语言陈述，判断输入文本与这些陈述的匹配程度。这种方法适用于快速原型开发...
xAI推出独立的Grok语音转文本和文本转语音API，目标用户为企业语音开发人员
埃隆·马斯克的 AI 公司 xAI 发布了两款音频 API：语音转文本（STT）和文本转语音（TTS）。STT 支持 25 种语言，提供实时和批量转录，错...
约翰·特纳斯将接替蒂姆·库克成为苹果公司的首席执行官
苹果公司宣布，约翰·特纳斯将于2026年9月1日接替蒂姆·库克成为新任首席执行官，库克将转任董事会执行主席。约翰·斯鲁吉被任命为新的硬件主管。库克在信中感...
阅读蒂姆·库克致苹果世界的信件，告别首席执行官职务
苹果首席执行官蒂姆·库克将在九月辞职，转任执行董事长，感谢用户的支持，并宣布约翰·特纳斯将接任CEO。库克回顾了15年的任期，期待特纳斯的领导能带来更大成就。
Write Amplification in Postgres: The 3-4x Tax on Every Insert
Every 1 KB insert in Postgres becomes ~2.5 KB of committed I/O before it'...
苹果公司任命Johny Srouji为首席硬件官
苹果公司任命Johny Srouji为新任硬件主管，接替即将成为CEO的John Ternus。Srouji自2008年加入苹果，负责苹果自家芯片的推出，...