MiniMax推出了新模型MiniMax-01,支持400万token的超长上下文,性能接近DeepSeek-v3和GPT-4o。该模型采用Lightning Attention架构,显著提升处理效率。在多个基准测试中,MiniMax-Text-01在长上下文理解方面表现突出,而MiniMax-VL-01则专注于多模态任务,展现强大处理能力。该模型已在Hailuo AI上免费试用。
当前多模态和多任务模型如4M和UnifiedIO在处理多样输入和任务上有局限。本文通过在多模态和大规模数据集上训练,扩展了4M的能力。我们使用语义、几何模态和伪标签等进行训练,引入新模态提升交互和生成能力,并扩展到三十亿参数模型,保持性能。
完成下面两步后,将自动完成登录并继续当前操作。