量子位 ·

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

清华唐杰团队通过AgentWrite方法成功将GLM-4和Llama-3.1的输出长度增加到7800字，翻了4倍。他们还生成了6000个长输出SFT数据，并将其添加到训练过程中。研究团队表示将进一步扩展模型的输出长度和质量，并提高效率。

🎯

🏷️

用本地大模型驱动中文输入法，我做了一个实验性的项目 - 曦远Code
该项目探索将大语言模型（LLM）应用于输入法，通过上下文理解优化候选词排序。用户输入拼音后，LLM根据语境提供更相关的词汇，提升输入体验。项目使用Node...
保护每一次 AI 调用的隐私安全 — 面向企业和个人的大模型安全接入网关
智链 AI 网关为企业和个人提供安全接入大模型的服务，具备数据脱敏、隐私保护和全链路审计功能，确保敏感信息不泄露。支持多种主流 AI 提供商，具备高可用性...
国产大模型编码能力实测(GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro)
本文对四款国产大模型（GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro）的编码能力进行了实测。结果显示，...
Faster Rust Testing at Scale: cargo-nextest in Practice
Disclaimer: This article was created using AI-based writing and communication...
Aurzen的迷你三折投影仪目前几乎打了六折
Not all trifolds are created equal — just ask our own Allison Johnson, who re...
Christophe Pettus: Two Hundred and Twelve Things
PostgreSQL 19 is an admin-and-monitoring release with 212 items: worker-manag...