量子位 ·

MiniMax开源4M超长上下文新模型！性能比肩DeepSeek-v3、GPT-4o

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

MiniMax推出了新模型MiniMax-01，支持400万token的超长上下文，性能接近DeepSeek-v3和GPT-4o。该模型采用Lightning Attention架构，显著提升处理效率。在多个基准测试中，MiniMax-Text-01在长上下文理解方面表现突出，而MiniMax-VL-01则专注于多模态任务，展现强大处理能力。该模型已在Hailuo AI上免费试用。

🎯

关键要点

MiniMax推出了新模型MiniMax-01，支持400万token的超长上下文。
MiniMax-01包含两个模型：MiniMax-Text-01和MiniMax-VL-01。
MiniMax-Text-01在长上下文理解方面表现突出，性能接近DeepSeek-v3和GPT-4o。
MiniMax-01采用Lightning Attention架构，显著提升处理效率。
模型在Hailuo AI上免费试用，API价格为输入每百万token0.2美元，输出每百万token1.1美元。
MiniMax-Text-01参数为456B，推理时可扩展到400万token上下文。
在Core Academic Benchmark中，MiniMax-Text-01在GPQA Diamond上获得54.4分，超越GPT-4o。
MiniMax-VL-01采用ViT-MLP-LLM框架，具有动态分辨率功能，适用于多模态任务。
网友们已开始测试MiniMax-01，表现令人印象深刻。

🔎

延伸解读

超长上下文的应用前景

MiniMax-01模型支持400万token的超长上下文，这为需要处理大量信息的应用场景提供了新的可能性。尤其在智能助手和对话系统中，能够更好地理解和生成长文本，提升用户体验。随着Agent技术的发展，这种能力将变得愈发重要。

与现有模型的比较

MiniMax-Text-01在多个基准测试中表现出色，尤其在长上下文理解方面超越了GPT-4o和DeepSeek-v3。这表明MiniMax-01在处理复杂任务时具有竞争力，用户在选择模型时可以考虑其在特定任务上的表现。

多模态处理能力

MiniMax-VL-01的多模态处理能力使其在视觉和语言任务中表现突出。其动态分辨率功能能够适应不同输入图像的需求，适合复杂的多模态应用，如图像描述生成和视觉问答。这为开发者提供了更多的创作空间。

❓

延伸问答

MiniMax-01模型的主要特点是什么？

MiniMax-01模型支持400万token的超长上下文，包含MiniMax-Text-01和MiniMax-VL-01两个子模型，采用Lightning Attention架构，显著提升处理效率。

MiniMax-Text-01在长上下文理解方面的表现如何？

MiniMax-Text-01在长上下文理解方面表现突出，在Core Academic Benchmark中获得54.4分，超越GPT-4o。

MiniMax-01的API价格是多少？

MiniMax-01的API价格为输入每百万token0.2美元，输出每百万token1.1美元。

MiniMax-VL-01模型的架构特点是什么？

MiniMax-VL-01采用ViT-MLP-LLM框架，具有动态分辨率功能，能够根据预设网格调整输入图像的大小。

MiniMax-01模型的训练数据来源是什么？

MiniMax-VL-01的训练数据涵盖标题、描述和指令，ViT在6.94亿图像-标题对上进行训练。

MiniMax-01模型的使用场景有哪些？

MiniMax-01模型适用于长上下文处理和多模态任务，特别是Agent相关应用。

🏷️