全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币
💡
原文中文,约2500字,阅读约需6分钟。
📝
内容提要
上海发布的Minimax M2开源模型以61分成为开源模型第一,突破智力、成本和速度的限制。其编程能力和推理速度优于Claude 3.5,成本仅为8%。M2支持多种工具调用,表现出色,目前限时免费使用。
🎯
关键要点
- 上海发布的Minimax M2开源模型以61分成为开源模型第一,突破智力、成本和速度的限制。
- Minimax M2的编程能力和推理速度优于Claude 3.5,成本仅为8%。
- M2支持多种工具调用,表现出色,目前限时免费使用。
- M2是一个稀疏度较高的MoE模型,总参数量230B,激活参数量仅有10B。
- M2在工具使用和深度搜索能力上不逊于海外顶尖模型,编程能力在国内名列前茅。
- M2的定价为每百万输入Token 0.3美元,输出Token 1.2美元,成本非常低廉。
- Minimax已将M2部署到Agent平台,限时免费使用,并展示了许多现成作品。
- M2采用全注意力机制,未使用SWA和Lightning Attention,选择适合自己的方式。
❓
延伸问答
Minimax M2的主要特点是什么?
Minimax M2以61分成为开源模型第一,突破智力、成本和速度的限制,编程能力和推理速度优于Claude 3.5,且成本仅为8%。
Minimax M2的定价策略是怎样的?
Minimax M2的定价为每百万输入Token 0.3美元,输出Token 1.2美元,成本非常低廉。
Minimax M2在编程能力上与其他模型相比如何?
在编程能力、工具使用和深度搜索能力上,M2在国内名列前茅,且在工具使用和深度搜索方面不逊于海外顶尖模型。
Minimax M2支持哪些工具调用?
M2支持Shell、浏览器、Python代码解释器和各种MCP工具的调用,表现出色。
Minimax M2的模型结构是什么样的?
M2是一个稀疏度较高的MoE模型,总参数量230B,激活参数量仅有10B。
Minimax M2的使用场景有哪些?
M2可以用于编程、生成调研报告、制作PPT,以及开发网页和在线应用等多种场景。
➡️