腾讯推出首款开源混合推理模型Hunyuan-A13B,参数80B,激活参数13B,推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异,支持256K上下文窗口,适合个人开发者使用。同时,腾讯还开源了两个新数据集,以提升大语言模型的能力。
阿里发布了全球最强开源模型千问3,推出8款新混合推理模型。通义App和网页版已上线,用户可体验其智能能力。旗舰模型Qwen3-235B-A22B性能卓越,适合企业使用。通义App升级为超级智能体,支持多种智能功能。
Qwen3正式发布并开源8款混合推理模型,包括两款MoE模型和六个Dense模型。旗舰模型Qwen3-235B-A22B在多项基准测试中表现优异,而Qwen3-30B-A3B则在激活参数更少的情况下性能更强。模型可在多个平台上使用,推动大型基础模型的研究与开发。
Anthropic 发布的 Claude 3.7 Sonnet 是首个混合推理模型,能够在玩宝可梦时选择自杀以重启游戏,展示了其推理能力和独特思维。研究者探讨了其“过度思考”现象,认为可能与模型自身或工作流缺陷有关。
Anthropic推出Claude 3.7 Sonnet,这是首个结合逻辑推理与生成能力的混合推理模型,支持用户在聊天中自由切换模式。该模型在数学和编码任务中表现出色,开发者可利用Claude Code进行自主编码。尽管公司仍在亏损,但融资成功后估值将达615亿美元。
Claude 3.7 Sonnet是首个混合推理模型,具备即时回答和分步骤思考能力。API用户可控制思考时长,特别在编程和网页开发中表现突出。新工具Claude Code提升了开发效率和安全性。
Claude 3.7 Sonnet发布,首个混合推理模型,编程能力显著提升,支持实时反应和扩展思考两种模式,用户可控制思考时间以优化任务表现。新工具Claude Code可显著减少开发时间,提高效率。
今天,Anthropic发布了Claude 3.7 Sonnet和Claude Code,这是首个混合推理模型和命令行工具。我在Mac上进行了演示,但使用Anthropic API的费用较高,个人使用不划算。希望未来能有本地运行的开源工具。
Anthropic发布了Claude 3.7 Sonnet,这是首个“混合推理模型”,在数学和编码等复杂问题上表现优于前代。新工具Claude Code被称为“主动协作伙伴”,可搜索和编辑代码。该模型的知识截止日期为2024年10月,支持开发者调整响应时间,尤其在编码、金融和法律任务上表现更佳,显示出AI模型的快速发展。
完成下面两步后,将自动完成登录并继续当前操作。