量子位 ·

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

TOKENSWIFT框架通过优化模型加载、KV缓存管理和Token生成策略，实现超长文本生成效率提升，生成10万Token仅需90分钟，传统方法需5小时，确保生成质量与多样性，支持DeepSeek-R1和QwQ，具有3倍加速效果。

🎯

🏷️

修复Pingora开源框架中的请求走私漏洞
2025年12月，Cloudflare发现Pingora框架存在HTTP/1.x请求走私漏洞，编号CVE-2026-2833、CVE-2026-2835和...
2026年你应该尝试的6个最佳AI代理记忆框架
Bala Priya C是一位来自印度的开发者和技术作家，专注于数学、编程、数据科学和内容创作。她的兴趣包括DevOps、数据科学和自然语言处理，热爱阅读...
卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k
卡帕西推出开源项目autoresearch，旨在让AI自主进行科研。该框架仅630行代码，支持单GPU运行，每5分钟进行一次实验，AI根据结果自我调整。未...
Viettel Solutions与Aduna Global在MWC 2026签署网络API服务框架协议
Viettel Solutions与Aduna Global在巴塞罗那签署网络API服务框架协议，旨在简化企业和开发者对先进网络能力的访问，符合GSMA ...
Anthropic推出Claude Code的多智能体代码审查工具
Anthropic的Claude Code产品负责人Cat Wu表示，代码审查自动化愈发重要。随着用户使用Claude Code，提交的PR数量显著增加，...
介绍Kasal
Agentic AI系统在组织中日益普及，提升生产力并减轻重复任务负担。Kasal平台旨在解决技术人才短缺，提供直观界面，帮助不同技能水平的用户设计和部署...