解道jdon.com ·

阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

💡 原文中文，约800字，阅读约需2分钟。

📝

内容提要

ModelScope和Hugging Face发布了Qwen-72B和Qwen-1.8B等新的语言模型，它们在3T令牌上进行训练，并支持32k上下文。Qwen在中文测试中击败了GPT-4，但在英语中仍落后于GPT4。Starling-LM-7B是一种开创性的大型语言模型，利用了GPT-4标记排名数据集和先进的训练方法，相对于GPT-4在MT Bench中获得了8.09分，为AI语言理解树立了高标准。

🎯

关键要点

ModelScope和Hugging Face发布了Qwen-72B和Qwen-1.8B等新的语言模型，支持32k上下文，训练在3T令牌上。
Qwen在中文测试中击败了GPT-4，但在英语中仍落后于GPT-4。
Qwen-72B的最大性能与GPT-3.5相当，所有基准测试均为普通话。
Starling-LM-7B是由加州大学伯克利分校开发的开创性大型语言模型，利用了GPT-4标记排名数据集和先进的训练方法。
Starling-LM-7B在MT Bench中获得8.09分，超越了除GPT-4和GPT-4 Turbo之外的其他模型，为AI语言理解树立了高标准。

🏷️

继续阅读

3D横板动作肉鸽《SlashZero》27号首测！5000 个测试资格，先到先得！
在Future Games Show和官方社区首曝后，我们很高兴看到这么多玩家喜爱《SlashZero》，也由衷感谢大家的支持！我们迫不及待地宣布：首次测...
阿里宣布AI战略商业目标；三星有望成iPhone图像传感器供应商；台积电先进工艺将涨价
阿里巴巴、苹果和小米等科技公司在AI领域积极投资，阿里巴巴计划未来五年收入超过1000亿美元，小米三年投入超过600亿元。台积电将涨价，三星可能成为iPh...
Qwen3.5-Max预览版首度亮相，阿里千问登顶中国最强模型
阿里巴巴的Qwen3.5-Max-Preview模型在LMArena榜单中首次亮相，得分1464，超越多款国际顶级模型，成为中国最强大模型。阿里巴巴位列全...
北航团队为龙虾安全紧急开刀！开源OpenClaw风险防御工具，梳理9大高危风险缓解措施
北航团队推出了ClawGuard Auditor安全防御工具，旨在检测恶意技能并保障用户系统安全。该工具具备全面的安全能力，覆盖全生命周期，提供九大高危风...
Cursor套壳Kimi败露，最强「自研」模型被锤！创始人：忘记署名了
Cursor被指控抄袭Kimi的开源模型，创始人承认未署名是失误。月之暗面负责人揭露Cursor的自研模型实为Kimi基础上修改，引发舆论热议，广泛讨论开...
Last Week's Scorpion Super Awesome 26w11 #512
抱歉，您提供的文本没有具体内容，无法进行总结。请提供详细的文章内容。

阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

内容提要

关键要点

标签

继续阅读