小红花·文摘

ollama 0.17 版本发布，改进了 OpenClaw 入门流程

实时互动网 ·

不同显寸对应的可运行的模型大小 - 蝈蝈俊

蝈蝈俊 ·

智谱推出GLM-4.6，编程能力超越Claude Sonnet 4，成为国内最强模型。其上下文长度提升至200K，推理和搜索能力增强，支持FP8+Int4混合量化，降低推理成本，价格大幅下调，用户享受高性价比服务。

真够卷的！DeepSeek更完智谱更：GLM-4.6，代码国内最强

量子位 ·

Claude Sonnet 4扩展至100万标记的上下文窗口

InfoQ ·

DeepSeek V3.1在上下文长度和多格式支持上有所提升，编程、写作和翻译能力显著增强，且价格比Claude低68倍。用户反馈积极，但存在一些API问题。

实测DeepSeek V3.1，不止拓展上下文长度

量子位 ·

本研究探讨了语言模型代理在自主体应用中的目标遵循问题，并提出了分析目标漂移的新方法。尽管最佳代理在困难评估中表现良好，但所有模型均显示出目标漂移，且与上下文长度增加的模式匹配敏感性相关。

Technical Report: Evaluating Goal Drift in Language Model Agents

BriefGPT - AI 论文速递 ·

Amazon Nova Premier 正式可用！

亚马逊AWS官方博客 ·

本研究提出了一种名为llm-jp-modernbert的现代BERT模型，旨在解决大规模语料库和长上下文的预训练问题。该模型在8192个标记的上下文长度上进行训练，尽管在下游任务中未超越现有基线，但在填充掩码评估中表现良好。

llm-jp-modernbert: A Modern BERT Model Trained on a Large-Scale Japanese Corpus with Support for Long Context Lengths

BriefGPT - AI 论文速递 ·

NVIDIA AI 发布 UltraLong-8B：超长上下文语言模型，旨在处理大量文本序列

实时互动网 ·

当前主流的大语言模型（LLM）上下文长度不断增加，已达到64K，部分新模型甚至可达1M。不同模型的token与字数换算比例各异，中文字符约为0.6个token。例如，阿里Qwen系列支持128K token，OpenAI的GPT-4.5支持128K输入和16K输出。

目前常见LLM的上下文长度 - 蝈蝈俊

蝈蝈俊 ·

本研究提出了一种新的递归神经网络机制Lattice，旨在降低序列学习中注意力机制的计算复杂性。Lattice通过利用K-V矩阵的低秩结构高效压缩内存，显著减少计算复杂度。实验结果表明，Lattice在不同上下文长度下的表现优于现有方法，尤其在上下文长度增加时，性能提升更为明显。

Lattice: Learning to Efficiently Compress Memory

BriefGPT - AI 论文速递 ·

解锁大型语言模型效率：长文本的成本优化策略

DEV Community ·

本研究探讨了大型语言模型（LLMs）在处理长上下文时的成本优化问题。通过比较不同参数、上下文长度和注意力头配置，发现较大模型与较少注意力头能以更低成本实现更低损失，为LLMs的发展提供了重要启示。

Cost-Optimal Grouped-Query Attention for Long-Context Large Language Models

BriefGPT - AI 论文速递 ·

在所有场合中应使用CAG而非RAG

DEV Community ·

深入探讨DeepSeek-R1：它是如何运作的以及它能做什么

The New Stack ·

在Microsoft Word中本地使用Mistral NeMo对10页以上内容进行摘要

DEV Community ·

本研究提出Giraffe模型，解决了视觉语言模型在处理多图像和高分辨率视频时的上下文长度不足问题，扩展至128K的上下文长度，性能显著提升。

Design Choices for Long Visual Language Models: GIRAFFE

BriefGPT - AI 论文速递 ·

大语言模型在自然语言处理领域取得了显著进展，但其上下文长度有限。本文探讨了扩展上下文长度的重要性、面临的挑战及现有策略，评估了技术复杂性，并讨论了研究共识问题，旨在为研究人员提供资源，推动该领域的发展。

长语境语言建模中困惑度的缺陷

BriefGPT - AI 论文速递 ·

本研究提出了ShifTed Rotray position embeddING（STRING）方法，旨在解决开源大型语言模型（LLMs）在上下文长度方面的不足。实验结果表明，STRING在无需额外训练的情况下，显著提升了模型在长上下文基准测试中的表现。

大型语言模型有效上下文长度为何不足？

BriefGPT - AI 论文速递 ·

rerank-2和rerank-2-lite：Voyage多语言重排序器的下一代

Voyage AI ·