小红花·文摘

美团龙猫LongCat推出新稀疏注意力机制LoZA，解码速度提升10倍，支持处理1M长文本。通过优化模型结构，降低计算复杂度，提高效率，同时保持稳定性能。该技术在长文本任务中优于同类模型，未来将支持动态稀疏比例，以适应不同场景需求。

美团龙猫LongCat技术升级！新注意力机制解码速度快10倍，还能处理1M超长文本

量子位 ·

智谱宣布开源旗舰模型GLM-4.7 对训练数据进行大规模清洗提升代码生成能力

蓝点网 ·

中国联通研究团队在AAAI 2026上发布了HiMo-CLIP模型，解决了长文本图像检索中的语义层级和单调性问题。该模型通过动态特征提取和对齐机制，显著提高了长短文本的检索精度，性能优于现有模型。

让大模型学会“高维找茬”，中国联通新研究解决长文本图像检索痛点｜AAAI 2026 Oral

量子位 ·

DeepSeek新模型DeepSeek-OCR通过视觉压缩文本，显著提升了长文本处理效率。在OmniDocBench基准测试中，压缩率小于10倍时准确率达到97%。研究者提出的“上下文光学压缩”方法模拟人类记忆机制，可能为AGI提供新思路。

DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源”

量子位 ·

vLLM中的DeepSeek-V3.2-Exp：细粒度稀疏注意力的应用

vLLM Blog ·

GPT-5发布后引发热议，Youtuber Berman展示其在魔方、网页Word、Excel等任务中的表现。尽管表现出色，但也遭到质疑，尤其是马斯克认为其不如Grok 4。GPT-5在多模态能力和长文本处理上有显著提升，但仍存在一些问题。

快来看看GPT-5第一波实测

量子位 ·

DeepSeek的梁文锋团队在ACL 2025获得最佳论文奖，提出了原生稀疏注意力（NSA）机制，处理长文本的速度提升了11倍，性能超越传统模型。NSA通过动态分层策略优化计算，显著提高推理和训练效率，尤其在复杂推理任务中表现突出。

DeepSeek下一代技术提前曝光，梁文锋署名论文获ACL2025最佳论文奖

量子位 ·

外部验证工具能否提高LLM作为评判者的标注质量

Apple Machine Learning Research ·

研究发现，长文本输入（超过1万tokens）会显著降低大型语言模型（LLM）的性能，准确率从90%降至50%。不同模型在处理长文本时表现差异，输入内容的语义特征和结构也会影响性能衰减。实验揭示了模型在长上下文任务中的局限性，建议优化指令和保存上下文以提升性能。

1万tokens是检验长文本的新基准，超过后18款大模型集体失智

量子位 ·

为什么主流大模型的上下文窗口都是128k？| 深度

实时互动网 ·

该研究提出了细粒度CLIP（FG-CLIP），通过生成16亿对长文本与图像，增强了模型对细微语义差异的识别能力。实验结果表明，FG-CLIP在多个任务中超越了原始CLIP及其他方法，有效提升了模型性能。

FG-CLIP：细粒度视觉与文本对齐

BriefGPT - AI 论文速递 ·

GPT-4.1与Claude 3.7 Sonnet及Gemini 2.5 Pro的比较

DEV Community ·

本研究提出FineLIP方法，解决CLIP模型在处理长文本时的局限性，通过细粒度对齐实现文本与图像的跨模态映射，实验结果表明其在长文本检索和生成任务中优于现有方法。

FineLIP: Enhancing CLIP's Capabilities through Fine-Grained Alignment with Longer Text Inputs

BriefGPT - AI 论文速递 ·

北大团队提出LIFT：将长上下文知识注入模型参数，提升大模型长文本能力

机器之心 ·

本研究回顾了大型语言模型在处理长文本时性能下降的问题，提出了四种解决方法：位置编码、上下文压缩、检索增强和注意力模式，并强调了长文本的评估及未来发展方向。

Research on Transformer Context Expansion: Methods and Evaluation

BriefGPT - AI 论文速递 ·

随着大模型在长文本处理任务中的应用日益广泛，如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。

机器之心 ·

长上下文嵌入模型在超过4000个标记后失去效果

Jina AI ·

本研究提出了一种新的服从-sympow变压器，旨在解决传统对称幂变压器在处理长文本时的信息保留不足问题。通过数据依赖的乘法门控和自适应旋转嵌入技术，该方法能够动态释放和存储容量，初步实验显示其在训练和评估中表现优异，有效克服了对称幂变压器的局限性。

对称幂变压器的服从变换

BriefGPT - AI 论文速递 ·

稀疏注意力再添一员，华为诺亚推出高效选择注意力架构ESA

机器之心 ·

飞桨PP-UIE是一个支持中英文的信息抽取大模型，具备强大的零样本和小样本学习能力，能够高效处理长文本，适用于多种应用场景。

通用信息抽取大模型PP-UIE开源发布，强化零样本学习与长文本抽取能力，全面适配多场景任务...

百度大脑 ·