量子位 ·

豆包大模型团队&港大新成果ByteCheckpoint为LLM万卡训练提效

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

字节跳动豆包大模型团队与香港大学合作提出了ByteCheckpoint大模型Checkpointing系统，旨在提升大模型训练效率，并解决现有Checkpoint技术问题，性能显著提升。豆包大模型团队已发布豆包大模型并通过字节跳动云服务平台提供服务。

🎯

🏷️

剪映即梦猫箱被约谈与AI标识新规解读
字节跳动旗下的剪映、即梦和猫箱因未有效落实AI生成内容标识规定被网信办约谈。监管要求内容需明确标识为AI生成，水印和指纹信息必须保留。尽管生成质量良好，但...
面向电商直播场景的全模态大模型推理加速方案
本文介绍了电商直播场景下的全模态理解大模型TLiveOmni在vLLM框架下的推理部署与量化优化。通过自定义插件和修复多模态Token排布，解决了vLLM...
Claude Mythos Preview 模型能力解析：大模型攻防实测与企业应对建议
绿盟科技的报告分析了Anthropic的Claude Mythos模型，指出其在0day漏洞挖掘和网络攻击中的高效能，可能增加开源供应链的风险。报告建议企...
300人团队实现OpenClaw零事故自动化运维全记录
文章介绍了如何在企业中使用AI智能体“龙虾”进行自动化运维。通过安全沙箱和权限管理，龙虾能够高效处理客户问题，提升团队协作和工作效率，同时确保数据安全和隐...
Jobin Augustine: Troubleshooting logical replication delay made easy
This blog is based on a real production case in which users experienced a ser...
Troubleshooting logical replication delay made easy
This blog is based on a real production case in which users experienced a ser...