小红花·文摘

免费领 50 万 Tokens！EdgeOne Makers AI Agent 部署实测

如有乐享 ·

Meta 正在限制员工的人工智能使用量，因最近 30 天内消耗高达 60 万亿 Tokens，预计将导致数十亿美元的支出。公司采取 Tokens 最小化策略，设定团队预算上限，并开发工具实时监控 AI 用量。其他科技公司如 Uber 和 Microsoft 也在实施类似措施以控制成本。

30天消耗60万亿Tokens！Meta发布备忘录宣布限制员工的AI用量以控制成本

蓝点网 ·

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

量子位 ·

苹果Siri AI系统提示词已经泄露超过1,300行指令提示词本身就有9,000 Tokens

蓝点网 ·

5亿Tokens白送！全球首个商用AI主机发布，终于能放开烧Token了

量子位 ·

在24GB M4 MacBook上跑本地大模型：Qwen 3.5-9B实测40 tokens/s，支持工具调用

dotNET跨平台 ·

上下文窗口被打破：Subquadratic推出1200万tokens的窗口

The New Stack ·

GitHub Copilot将于2026年6月1日起实施按量计费模式，因应对不断上涨的成本。每个订阅套餐将获得相应的AI信用点，使用量按tokens计算。开发者可提前了解费用并选择购买额外信用点。不同订阅的信用点和费用已公布，企业用户可共享未使用的信用点。

Copilot从6月1日开始转为按量计费根本原因是GitHub难以承受不断飙涨的成本

蓝点网 ·

ICLR 2026 丨单任务可训练参数减少 125 倍！新方法 Task Tokens 助力具身智能提升复杂任务能力

HyperAI超神经 ·

人工智能Claude Opus 4.6和Claude Code近期性能显著下降，用户和开发者对此表示不满。开发者指出模型在复杂任务中的表现不佳，指令遵循能力下降，错误率上升。Anthropic承认调整了模型的努力程度以减少算力消耗，导致用户配额消耗加快，部分开发者质疑此举是为降低成本以准备上市，若不解决算力问题，可能会失去用户。