小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Claude Opus 4.7新模型发布:用户吐槽性能缩水与算力消耗暴涨

Claude Opus 4.7模型发布后,用户对其性能下降和成本上升表示不满。尽管推理能力有所增强,但token消耗增加影响了用户体验。自适应思考机制增加了不确定性,用户感到被操控。在AI商业化过程中,普通用户面临限制,而企业用户则享受更稳定的服务。用户需调整期望,降低对AI的依赖,并准备备用方案。

Claude Opus 4.7新模型发布:用户吐槽性能缩水与算力消耗暴涨

极道
极道 · 2026-04-16T22:15:00Z

Anthropic 承认 Claude Code 在工作日高峰期配额消耗加快,约 7% 的用户会更快触发限制。自 3 月 23 日起,用户反映配额消耗过快,影响任务执行时间。公司未提前通知调整,建议开发者在非高峰期执行大任务。

Claude Code配额消耗速度比以前更快?A社承认已经调整配额分配方式

蓝点网
蓝点网 · 2026-03-27T04:22:49Z
参议员们正在推动了解数据中心实际使用的电力消耗

美国参议员沃伦和霍利致信能源信息管理局,要求收集数据中心的年度能源使用数据,以应对电力成本上升,旨在提高透明度,支持政策制定,防止大公司加重家庭电费负担。同时,多个州也在考虑暂停新数据中心建设。

参议员们正在推动了解数据中心实际使用的电力消耗

The Verge
The Verge · 2026-03-26T14:25:32Z
新的令牌对象表示法(TOON)希望通过减少令牌消耗来降低大型语言模型(LLM)的成本

最近发布的令牌对象表示法(TOON)旨在成为一种模式感知的JSON替代方案,能显著减少令牌消耗,某些情况下比JSON少用40%。TOON结合了YAML和CSV的布局,适用于不同数据结构,且准确性良好。TOON 1.0已在MIT许可证下发布。

新的令牌对象表示法(TOON)希望通过减少令牌消耗来降低大型语言模型(LLM)的成本

InfoQ
InfoQ · 2025-11-23T02:49:00Z
加速大语言模型推理: 降低资源消耗的高效 KV 缓存系统 | 开源日报 No.706

YTSage 是一款基于 PySide6 的 YouTube 视频下载工具,具备多种下载和字幕处理功能。LMCache 提升大语言模型性能,支持高效缓存。creator-docs 提供 Roblox 开发文档,WarpShare 停止维护,Code Racer 是一款多人在线编程游戏。

加速大语言模型推理: 降低资源消耗的高效 KV 缓存系统 | 开源日报 No.706

开源服务指南
开源服务指南 · 2025-08-24T15:35:37Z
人工智能模型的能源和水资源消耗上升及其减少方法

人工智能的能源和水资源消耗引发关注,尤其是大型机器学习模型和数据中心。可持续AI旨在降低技术对环境的影响。专家指出,AI和数据中心占全球电力使用的2-3%,且水冷却需求高。通过优化硬件、改进算法和使用可再生能源,可以减少环境影响。企业应将IT采购与可持续目标对齐,实施最佳实践以降低碳排放。

人工智能模型的能源和水资源消耗上升及其减少方法

InfoQ
InfoQ · 2025-06-26T11:08:00Z

空结构体在Go语言中不占用内存,适合用于高效的数据结构和并发模式。可用于实现集合、信号通知和无状态方法,合理使用可降低内存占用,提高性能。

Go语言空结构体:零内存消耗的高效编程

郑文峰的博客
郑文峰的博客 · 2025-06-14T19:41:46Z
苹果手表卡路里消耗误差高达28%;特朗普将第三次给予TikTok宽限期;周鸿祎称准备干掉360整个市场部

苹果手表卡路里消耗误差高达28%;特朗普再次给予TikTok宽限期;周鸿祎计划解散360市场部;亚马逊在台湾投资50亿美元;Meta考虑投资Scale AI超百亿美元;特斯拉人形机器人项目主管离职。

苹果手表卡路里消耗误差高达28%;特朗普将第三次给予TikTok宽限期;周鸿祎称准备干掉360整个市场部

全球TMT-美通国际
全球TMT-美通国际 · 2025-06-09T04:19:51Z
到2025年底,人工智能的电力消耗可能超过比特币

预计到2025年底,人工智能的电力需求将接近全球数据中心电力消耗的一半。目前,AI已占数据中心电力的五分之一,且需求持续上升。尽管大公司设定了气候目标,但缺乏透明度使得评估AI的环境影响变得困难。未来AI能效的提升是否能减缓电力需求仍然存在疑问。

到2025年底,人工智能的电力消耗可能超过比特币

The Verge
The Verge · 2025-05-29T18:58:37Z

阿里通义推出PARSCALE新策略,使1.6B模型性能接近4.4B,内存占用仅为1/22,延迟增加1/6。该方法通过并行计算和动态聚合权重,显著提升模型能力,训练成本降低98%。

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

量子位
量子位 · 2025-05-28T07:10:29Z
从概念到代码:打造智能卡路里消耗追踪器

本文介绍了一款卡路里消耗计算器的开发,旨在提供准确的卡路里估算和个性化的健身跟踪。该应用具有动态主题切换、实时计算和成就系统,帮助用户理解能量消耗和跟踪进展。

从概念到代码:打造智能卡路里消耗追踪器

DEV Community
DEV Community · 2025-04-07T03:30:00Z
全新CoD颠覆推理范式,准确率接近但token消耗成倍降低

Zoom 研究团队提出了 Chain of Draft(CoD)技术框架,以提高大语言模型(LLM)的推理效率。CoD 通过生成简洁且信息密集的输出,显著降低计算资源和延迟,提升推理性能。实验结果显示,CoD 在多步推理任务中的信息密度是传统思维链(CoT)的 14.7 倍,推理延迟和 token 消耗显著减少,适合高频金融交易等应用。

全新CoD颠覆推理范式,准确率接近但token消耗成倍降低

机器之心
机器之心 · 2025-03-10T10:29:59Z
MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能

AIxiv专栏促进学术交流,报道超过2000篇内容。UT Austin与Meta AI联合推出APOLLO训练策略,显著降低大语言模型的内存需求并提升性能,为资源有限的研究者提供高效训练的新方案。

MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能

机器之心
机器之心 · 2025-02-27T03:41:56Z
监控人工智能API和应用的成本与消耗

人工智能的兴起改变了企业运营,推动了对大型语言模型(LLM)API的需求。Moesif提供实时监控和成本分析,帮助企业识别高成本客户,优化资源使用,提升盈利能力。通过定制仪表板和警报系统,企业能更有效地管理API成本,确保可持续发展。

监控人工智能API和应用的成本与消耗

DEV Community
DEV Community · 2025-02-20T18:56:52Z

在AI时代,日均消耗10亿Tokens已成为企业AI业务成功的标志。目前,中国已有200家企业达成此标准,涵盖多个行业。随着大模型应用的成熟,企业应努力实现这一目标,以把握商业机会。

AI时代不看独角兽,看10亿Tokens日均消耗

量子位
量子位 · 2025-01-23T01:56:12Z
阶跃公开了自家新型注意力机制:KV缓存消耗直降93.7%,性能不减反增

AIxiv报道了一种新型注意力机制——多矩阵分解注意力(MFA),该机制显著降低了语言模型的推理成本,并提升了性能。MFA在内存使用上节省高达93.7%,兼容多种位置编码,解决了大语言模型的显存瓶颈,推动了其应用。

阶跃公开了自家新型注意力机制:KV缓存消耗直降93.7%,性能不减反增

机器之心
机器之心 · 2025-01-17T05:22:11Z

本研究提出了自动化算法AutoDoS,旨在解决大型语言模型在黑盒环境中的拒绝服务攻击问题。实验结果表明,AutoDoS显著增加了服务延迟并消耗资源,展现了其隐蔽性和有效性。

通过自动生成实现LLM拒绝服务攻击的资源消耗:黑盒设置下的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
通过观察功能跟踪构建指标和资源消耗

观察功能的测试版现已提供额外的构建指标,包括构建时间、内存和磁盘使用情况,以及各步骤的P50和P90持续时间。监控用户可通过Vercel项目中的新观察标签访问此功能。

通过观察功能跟踪构建指标和资源消耗

Vercel News
Vercel News · 2024-11-07T13:00:00Z

本文提出了一种创新方法,解决混合动力汽车在扰动下的受限最优燃料消耗问题。研究中应用了七种训练方法,结果表明六种方法有效应对扰动,优化燃料消耗。

考虑观测扰动的混合动力汽车受限最优燃料消耗

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

微软发布的Windows 11 24H2版进行了底层改进,显著提升了累积更新的安装速度和资源消耗。测试显示,安装时间缩短43.6%,重启时间缩短33.5%,CPU使用率降低25%。这些改进通过并行处理组件清单和优化RAM使用实现,提升了更新性能。

微软介绍Windows 11 24H2底层改进:加快补丁安装速度并减少资源消耗

蓝点网
蓝点网 · 2024-10-23T04:29:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码