InfoQ ·

麻省理工学院的递归语言模型提升了长上下文任务的表现

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

麻省理工学院的研究人员提出了一种递归语言模型（RLM），旨在提升大语言模型（LLM）在长上下文任务中的表现。RLM通过编程环境递归处理输入，能够处理比基础LLM长100倍的提示。其核心在于利用编程语言（如Python）生成代码，以分块或搜索正则表达式等方式预处理提示。研究表明，RLM在长上下文基准测试中优于其他策略，有效解决了上下文窗口限制的问题。

🎯

关键要点

麻省理工学院的研究人员提出了一种递归语言模型（RLM），旨在提升大语言模型（LLM）在长上下文任务中的表现。
RLM通过编程环境递归处理输入，能够处理比基础LLM长100倍的提示。
RLM的核心思想是利用编程语言（如Python）生成代码，以分块或搜索正则表达式等方式预处理提示。
研究表明，RLM在长上下文基准测试中优于其他策略，有效解决了上下文窗口限制的问题。
尽管前沿LLM通常具有非常大的上下文窗口，但用户发现当上下文变大时，模型会出现上下文衰退的问题。
MIT将RLM实现为Python REPL Notebook，允许根语言模型通过编写代码与REPL环境交互。
这种方案的好处在于根模型不会接收完整的上下文作为输入，从而避免了上下文窗口的拥堵。
MIT团队成员Alex Zhang称这种方法为“苦涩教训的方式”，强调局部查看输入的有效性。
实现RLM的代码已在GitHub上发布。

❓

延伸问答

递归语言模型（RLM）是什么？

递归语言模型（RLM）是一种通过编程环境递归处理输入，以提升大语言模型（LLM）在长上下文任务中的表现的技术。

RLM如何解决上下文窗口限制的问题？

RLM通过将提示分块处理，利用编程语言生成代码，避免将完整上下文作为输入，从而有效解决上下文窗口的拥堵问题。

RLM在长上下文基准测试中的表现如何？

研究表明，RLM在长上下文基准测试中优于其他策略，有效提升了模型的表现。

MIT是如何实现递归语言模型的？

MIT将RLM实现为Python REPL Notebook，允许根语言模型通过编写代码与REPL环境交互。

RLM的优势是什么？

RLM的优势在于根模型不会接收完整的上下文输入，能够更有效地处理长上下文任务，避免上下文衰退。

RLM的代码在哪里可以找到？

实现RLM的代码已在GitHub上发布，用户可以访问获取。

🏷️

继续阅读

Nvidia最新模型现已上线
Nvidia发布了Nemotron 3 Ultra模型，拥有5500亿参数，支持高达100万标记的上下文窗口。该模型速度显著提升，能节省用户30%的成本。...
MiniCPM5-1B采用RL+OPD训练，多项复杂任务达SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench
TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨...
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...
开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...
Miso Labs发布MisoTTS：一款拥有开放权重的80亿情感文本转语音模型
Miso Labs发布了MisoTTS，这是一款拥有80亿参数的文本转语音模型，采用残差矢量量化技术，能够根据文本和音频上下文生成富有表现力的语音。该模型...