量子位 ·

清华厦大等提出“无限长上下文”技术，100万大海捞针全绿，Llama\Qwen\MiniCPM都能上分

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

清华、厦大等提出的LLMxMapReduce技术突破了大模型的记忆限制，实现了“无限长”上下文。该技术通过将长文本切分为片段并并行处理，提取关键信息并汇总答案。实验表明，结合此框架的模型在处理超长文本时表现优异且速度较快，具有广泛的应用潜力。

🎯

关键要点

清华、厦大等提出的LLMxMapReduce技术突破了大模型的记忆限制，实现了无限长上下文。
LLMxMapReduce通过将长文本切分为片段并并行处理，提取关键信息并汇总答案。
该技术结合结构化通信协议和上下文置信度校准机制，有效处理跨片段信息。
LLMxMapReduce在处理超长文本时表现优异，速度较快，具有广泛的应用潜力。
与其他分治式长文本处理方法相比，LLMxMapReduce在处理跨片段依赖和冲突方面具有优势。
实验结果显示，结合LLMxMapReduce框架的模型在InfiniteBench评测中得分超越了多种闭源和开源模型。
LLMxMapReduce的结构化通信协议和上下文置信度校准机制对框架性能至关重要。
在大海捞针测试中，LLMxMapReduce能够有效处理长度达到1280K token的序列，表现出卓越能力。
LLMxMapReduce的处理速度优于其他同类型分治框架，具有明显的速度优势。

❓

延伸问答

LLMxMapReduce技术的主要创新点是什么？

LLMxMapReduce技术通过将长文本切分为片段并并行处理，突破了大模型的记忆限制，实现了无限长上下文。

LLMxMapReduce如何处理跨片段信息？

LLMxMapReduce采用结构化通信协议和上下文置信度校准机制，有效处理跨片段依赖和冲突信息。

LLMxMapReduce在处理超长文本时的表现如何？

LLMxMapReduce在处理超长文本时表现优异，能够有效处理长度达到1280K token的序列，且速度较快。

与其他分治式长文本处理方法相比，LLMxMapReduce有哪些优势？

LLMxMapReduce在处理跨片段依赖和冲突方面具有优势，能够更好地整合信息，减少错误结论的产生。

LLMxMapReduce的实验结果如何？

结合LLMxMapReduce框架的模型在InfiniteBench评测中得分超越了多种闭源和开源模型，表现出强大的通用性。

LLMxMapReduce的处理速度与其他框架相比如何？

LLMxMapReduce的处理速度优于其他同类型分治框架，具有明显的速度优势。

🏷️

继续阅读

让原生体验「接地气」：Pixel Text 与「原点系列」工具集
本文介绍了开发者推出的应用Pixel Text，旨在改善原生短信体验。该应用提炼短信中的关键信息，如验证码和取件码，减少用户查找成本。同时，通过本地模型识...
扩展企业对话智能：由Databricks Genie驱动的跨行业技术和功能解决方案
Databricks Genie利用自然语言处理技术，推动各行业的数据民主化和智能化，优化财务规划、法律合规和IT运营等功能。与合作伙伴开发的工具结合，提...
2026年实时音视频如何重塑”一起冥想”体验：纯净人声、空间音效与AI引导的技术落地
“一起冥想”是一款多人在线同步冥想应用，基于ZEGO的低延迟音视频技术，提供清晰的人声、沉浸式音效和实时互动。用户可通过AI降噪和3D音效在虚拟空间中体验...
从任意视角探索场景：3D体积视频技术突破意味着3D流媒体可能很快成为现实
布朗大学研究人员推出了名为PackUV的3D体积视频处理方法，旨在实现可存储、流式传输的逼真3D视频。该技术通过多台摄像机拍摄场景，并利用算法重建三维空间...
2026世界杯黑科技曝光：引入AI技术就能告别误判吗？
2026年美加墨世界杯将引入智能用球和AI数字分身等多项AI新技术，以提升判罚精度和观赛体验。同时，中央广播电视总台与国际足联达成版权合作，涵盖未来多届世界杯赛事。
微软押注企业AI竞赛将依赖数据上下文而非模型能力
微软在Build 2026开发者大会上推出了Microsoft Fabric，旨在解决企业AI中的数据上下文问题。新平台包括HorizonDB数据库、GP...