小红花·文摘 - 小红花技术领袖俱乐部

DeepSeek-V4 技术解析：架构革新与 Coding Agent 后训练优化

DeepSeek-V4 技术解析：架构革新与 Coding Agent 后训练优化

jax - 走在路上 ·

DeepSeek-V4来了：一百万Token上下文，意味着AI终于能“读完整本书”了吗？

DeepSeek-V4来了：一百万Token上下文，意味着AI终于能“读完整本书”了吗？

dotNET跨平台 ·

五种高效的长上下文检索增强生成技术

五种高效的长上下文检索增强生成技术

MachineLearningMastery.com ·

递归语言模型RLM颠覆智能体：RLM代码递归破解长上下文

递归语言模型RLM颠覆智能体：RLM代码递归破解长上下文

极道 ·

微软发布全新的多语言嵌入模型 Harrier-OSS-v1，为多种语言提供高质量的语义表示

微软发布全新的多语言嵌入模型 Harrier-OSS-v1，为多种语言提供高质量的语义表示

实时互动网 ·

LUCID Attention：给长上下文模型戴上降噪耳机

LUCID Attention：给长上下文模型戴上降噪耳机

Micropaper ·

作者探讨了AI模型的进展，分享了使用RTX4090显卡和vLLM框架的体验。通过DeepSeek的新模型，长上下文处理能力显著提升，理解和生成内容的能力增强。尽管硬件更新迅速，AI软件优化同样至关重要，展现出无限潜力。

近期LLM的部署与应用经历(3)

Mayx的博客 ·

麻省理工学院的递归语言模型提升了长上下文任务的表现

麻省理工学院的递归语言模型提升了长上下文任务的表现

InfoQ ·

长上下文长度的旋转位置嵌入

长上下文长度的旋转位置嵌入

MachineLearningMastery.com ·

T5Gemma 2是基于Gemma 3的多模态长上下文编码器-解码器模型，采用绑定词嵌入和合并注意力机制，显著减少参数量。它支持图像与文本处理，具备更大的上下文窗口和多语言能力，适合快速实验和应用。

T5Gemma 2：下一代编码器-解码器模型

The Keyword ·

T5Gemma 2是基于Gemma 3的多模态长上下文编码器-解码器模型，采用绑定词嵌入和合并注意力机制，显著减少参数数量。它支持图像和文本处理，具备更长的上下文窗口和多语言能力，适合快速实验和应用部署。

T5Gemma 2：下一代编码器-解码器模型

The Keyword ·

Kimi K2思维：我国思维模型的真正觉醒

Kimi K2思维：我国思维模型的真正觉醒

云原生 ·

在线教程丨Deepseek-OCR以极少视觉token数在端到端模型中实现SOTA

在线教程丨Deepseek-OCR以极少视觉token数在端到端模型中实现SOTA

HyperAI超神经 ·

递归语言模型

递归语言模型

blank ·

$一文通透Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略：将粗粒度的token压缩与细粒度的token选择相结合$

一文通透Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略：将粗粒度的token压缩与细粒度的token选择相结合

结构之法算法之道 ·

vLLM 现已支持 Qwen3-Next：极高效率的混合架构

vLLM 现已支持 Qwen3-Next：极高效率的混合架构

vLLM Blog ·

Qwen团队发布Qwen3-Coder，一个大型自主编码模型及其开源工具

Qwen团队发布Qwen3-Coder，一个大型自主编码模型及其开源工具

InfoQ ·

MiniMax M1技术闭门会讨论了模型架构创新、强化学习训练及长上下文应用等前沿话题。与会者认为，强化学习可以在有限上下文下提升模型能力并改变输出分布。长上下文模型在法律合规分析和客户研究等企业应用中展现出巨大潜力。混合架构被视为未来主流，能提高推理效率和模型能力。

MiniMax M1全球技术闭门会实录：RL、混合架构、长上下文的下一步

量子位 ·

MiniMax发布M1：一款用于长上下文推理和软件任务的4560亿混合注意力模型

MiniMax发布M1：一款用于长上下文推理和软件任务的4560亿混合注意力模型

InfoQ ·

OpenAI最新的推理模型o3-pro受到关注，但测试显示其推理能力有限，常常只对部分字母正确。前员工Miles Brundage批评苹果的推理研究为模式匹配。o3-pro在短上下文中表现良好，但在长上下文处理上不如Gemini 2.5 Pro。用户Ben Hylak认为，o3-pro需要更多背景信息以发挥最佳能力，并在工具使用和环境理解上有所提升。

o3-pro答高难题文字游戏引围观，OpenAI前员工讽刺苹果：这都不叫推理那什么叫推理

量子位 ·