小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
智谱公布“降智”的秘密:Scaling不可避免的痛

智谱发布技术博客,讨论GLM-5系列模型在高负载下出现的乱码和复读现象。团队发现问题源于推理状态管理和KV Cache的竞态,提出在线异常监控策略和KV Cache分层存储方案,显著提升系统处理能力。未来,维护推理基础设施的输出质量将至关重要。

智谱公布“降智”的秘密:Scaling不可避免的痛

量子位
量子位 · 2026-05-01T11:00:05Z
阿里云 Coding Plan Bug:流式输出内容截断

本文讨论了阿里云百炼平台GLM-5模型的严重bug:流式输出内容截断。用户在发送简单问候消息时,回复内容被截断,导致最后几个字符丢失。阿里云售后认为是工具问题,但分析显示这是服务端生成逻辑的bug。建议阿里云修复以确保所有token完整发送,并增加测试以检查输出完整性。

阿里云 Coding Plan Bug:流式输出内容截断

Eric's Blog
Eric's Blog · 2026-04-20T00:00:00Z
华为云MaaS在香港完成全新升级,正式支援GLM-5模型

华为云在香港升级MaaS,支持GLM-5模型,并将在下半年推出CodeArts和AgentArts智能体平台。CodeArts提高代码续写准确率30%,减少Tokens消耗;AgentArts提供一站式智能体开发方案,缩短生产时间并确保高可靠性。

华为云MaaS在香港完成全新升级,正式支援GLM-5模型

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-07T02:22:59Z
开放模型已跨越一个新阶段

开放模型如GLM-5和MiniMax M2.7在核心任务上与封闭模型相当,且成本和延迟更低。评估显示,开放模型在文件操作、工具使用和指令跟随等方面表现良好,适合生产环境,成为开发者的理想选择。

开放模型已跨越一个新阶段

LangChain Blog
LangChain Blog · 2026-04-02T17:51:54Z
vLLM 部署 GLM-5 实践指南

本文介绍了如何在生产环境中使用 vLLM 部署 GLM-5 模型,包括模型下载、镜像构建和 Docker 部署。GLM-5 是智谱 AI 最新的大语言模型,具备强大的推理能力。文章详细说明了安装 HuggingFace CLI、下载模型、构建自定义镜像及服务验证等步骤,并提供了性能基准测试结果,显示 INT4 版本在特定环境下的高吞吐量。

vLLM 部署 GLM-5 实践指南

探索云原生
探索云原生 · 2026-03-25T20:00:00Z
Claude Code 也能跑本地模型?CCR 多模型 智能路由,成本直降 90%

本文介绍了通过Claude Code Router(CCR)实现本地模型部署和多模型智能路由的方法,降低AI编程助手的使用成本。用户可通过CCR对接开源模型GLM5,实现零成本使用,并根据任务类型自动选择合适模型,优化资源利用和成本。合理配置后,月成本可降低90%以上,适合开发者寻找高性价比的AI解决方案。

Claude Code 也能跑本地模型?CCR 多模型 智能路由,成本直降 90%

探索云原生
探索云原生 · 2026-03-18T20:00:00Z
免费无限量的 GLM-5、Qwen3.5-398B 模型,AtomGit 限时免费

AtomGit推出限时活动,用户可免费使用GLM-5和Qwen3.5-398B模型。但OpenClaw的上下文限制为16K,可能存在设置错误。注册后可调用多种模型,需注意用量。

免费无限量的 GLM-5、Qwen3.5-398B 模型,AtomGit 限时免费

小众软件
小众软件 · 2026-03-06T14:24:13Z
GLM-5:从「氛围编程」到「智能体工程」的范式跃迁

GLM-5是智谱AI与清华大学联合推出的基础模型,拥有7440亿参数,采用异步强化学习,支持多种思维模式,适配中国芯片生态,基准测试表现优异,标志着AI领域的重大突破。

GLM-5:从「氛围编程」到「智能体工程」的范式跃迁

Micropaper
Micropaper · 2026-03-01T08:00:00Z

智谱GLM-5技术论文公开,展示其在长任务处理上的能力,支持多种国产芯片。通过引入稀疏注意力机制和异步强化学习,显著提升了效率。GLM-5在多项评测中表现优异,成为开源AI领域的重要模型,受到国际关注。

智谱GLM-5技术全公开!完全适配华为等国产芯片,美国网友酸了

量子位
量子位 · 2026-02-23T05:19:44Z

GLM-5发布后表现优异,连续运行24小时,成功开发GBA模拟器,完成复杂任务。其编程能力与Claude Opus 4.5相当,标志着开源AI的质变,可能重塑SaaS行业。

GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!

量子位
量子位 · 2026-02-14T08:14:45Z
华为云码道(CodeArts)代码智能体接入智谱GLM-5:Agentic时代开源模型标杆

智谱AI发布了开源模型GLM-5,该模型具备SOTA水平的编程与智能体能力,擅长复杂系统工程,能够自主进行长程规划与执行。华为云码道已接入该模型。

华为云码道(CodeArts)代码智能体接入智谱GLM-5:Agentic时代开源模型标杆

华为云官方博客
华为云官方博客 · 2026-02-14T06:24:43Z
派早报:智谱上线并开源 GLM-5 模型、网信办开展春节清朗行动

智谱于2月11日开源GLM-5模型,全球排名第4,开源模型第1,强调系统化工程理解与复杂开发能力。该模型在多个基准测试中表现优异,并已适配多种国产算力平台。同时,智谱调整了GLM Coding Plan的价格,整体涨幅超过30%。

派早报:智谱上线并开源 GLM-5 模型、网信办开展春节清朗行动

少数派
少数派 · 2026-02-13T00:30:55Z
体验完智谱刚刚发布的 GLM-5,我终于明白它为什么让硅谷猜破了头

智谱发布的GLM-5模型“Pony Alpha”已开源,展现出卓越的编程能力,能够生成复杂代码和模拟程序,标志着国产AI生态的进步。其训练方式采用新型“Slime”框架,提升学习效率。未来,AI将简化编程,人类的审美和判断力将变得更加重要。

体验完智谱刚刚发布的 GLM-5,我终于明白它为什么让硅谷猜破了头

爱范儿
爱范儿 · 2026-02-12T05:40:48Z
谷歌可能很快就会推出Gemini 3.1 Pro模型 相关竞技场已经出现该模型的引用

谷歌即将推出Gemini 3.1系列模型,目前已有Gemini 3.1 Pro Preview的引用,但具体发布时间和特性尚未确定。智谱已开源GLM-5,谷歌的Gemini 3.1可能会有类似版本,具体情况需等待官方发布。

谷歌可能很快就会推出Gemini 3.1 Pro模型 相关竞技场已经出现该模型的引用

蓝点网
蓝点网 · 2026-02-12T03:47:30Z
智谱称GLM Coding Plan需求火爆且成本不断上涨 即日起调整首次购买优惠并涨价

智谱AI编程套餐需求激增,决定取消首次购买折扣并提高Lite和Max订阅价格。现有用户可按原价续订。GLM-5模型将逐步向Pro用户提供,Lite仅支持旧版模型。新价格将于2026年2月11日起生效。

智谱称GLM Coding Plan需求火爆且成本不断上涨 即日起调整首次购买优惠并涨价

蓝点网
蓝点网 · 2026-02-12T03:28:03Z
智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务

智谱发布并开源GLM-5模型,参数规模达到7440亿,显著提升复杂系统工程和长时域智能体任务的性能。GLM-5在多项基准测试中优于其他开源模型,缩小与前沿模型的差距,支持MIT许可证,任何人均可使用。

智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务

蓝点网
蓝点网 · 2026-02-12T02:49:41Z
智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex

智谱GLM-5新发布,增强了复杂系统工程和长程任务能力,整体表现优于前代。与Opus 4.6和GPT-5.3相比,GLM-5在网页设计和Laravel转Next.js等任务中表现出色,生成代码可靠,用户体验良好,是国产开源模型的强劲竞争者。

智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex

阮一峰的网络日志
阮一峰的网络日志 · 2026-02-12T01:26:13Z
GLM-5现已在AI Gateway上线

GLM-5现已通过AI Gateway提供,无需额外账户。相比GLM-4.7,GLM-5增加了多种思维模式、改进的长程规划和记忆,擅长处理复杂任务和数据提取。使用时在AI SDK中设置为zai/glm-5。

GLM-5现已在AI Gateway上线

Vercel News
Vercel News · 2026-02-11T13:00:00Z

智谱AI的GLM-5架构曝光,采用DeepSeek稀疏注意力机制和多Token预测,参数量达到745B,是GLM-4.7的两倍。新模型Pony Alpha被认为是GLM-5的测试版。智谱股价在两天内上涨60%,预计GLM-5将在2026年春节前发布。

GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力

量子位
量子位 · 2026-02-10T07:59:24Z

OpenRouter推出的神秘模型“Pony Alpha”专注于编码、推理和角色扮演,具有200K的上下文窗口。网友猜测其可能是GLM-5,因其表现与顶级模型相当,并在春节前发布引发关注。

神秘模型「Pony Alpha」火了,被曝是GLM-5

量子位
量子位 · 2026-02-09T08:39:28Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码