vLLM Blog ·

追求100%准确性：深入探讨Kimi K2在vLLM上的工具调用调试

💡 原文英文，约2100词，阅读约需8分钟。

📝

内容提要

为确保与vLLM的最佳兼容性，使用在特定提交后更新的Kimi K2模型。文章讨论了Kimi K2模型在vLLM上的调试过程，解决了三大兼容性问题，显著提高了工具调用成功率，并通过与Kimi团队的合作实现了性能改善。

🎯

❓

初始测试结果显示Kimi K2在vLLM上的工具调用成功率低于20%，仅成功解析218个工具调用。

遇到的三大兼容性问题包括缺少add_generation_prompt参数、空内容导致的提示格式错误，以及工具调用ID解析过于严格。

通过与Kimi团队合作，更新了模型的tokenizer_config.json，明确声明了add_generation_prompt参数，并改进了chat_template的逻辑。

最终测试结果显示成功解析的工具调用数量从218增加到971，成功率提升至99.925%。

chat_template是模型与服务框架之间的关键接口，确保其逻辑与框架的行为一致至关重要。

未来的改进方向包括在vLLM中集成工具调用的“执法者”组件，以防止模型产生未声明的工具调用。

🏷️

⚠️重要安全提醒：开源密码管理器Bitwarden CLI命令行工具遭到供应链攻击
开源密码管理器Bitwarden的CLI工具遭到供应链攻击，相关NPM包被植入恶意代码，可能窃取用户敏感信息。用户应检查CI日志并更换暴露的令牌。目前确认...
特斯拉的Cybercab开始生产——那么马斯克为什么要踩刹车？
Tesla's Cybercab is now in production at the company's Gigafactory in...
Scaling Camera File Processing at Netflix
Orchestrating Media Workflows Through Strategic CollaborationAuthors: Eric Re...
AirPods、Touch Bar及蒂姆·库克的其他遗产
We knew at some point Tim Cook would step down from his position as Apple'...
特朗普手机仍然不真实
特朗普手机尚未发布，尽管网站更新了设计和规格，但缺乏实际发布信息。用户需支付100美元预订金，售价499美元的“促销价”并不保证。公司未发布新闻稿，社交媒...
我认为格温妮斯·帕特洛不知道什么是肽
文章讨论了Gwyneth Paltrow及其品牌Goop对肽类产品的推广。尽管肽在健康和美容领域受到关注，Paltrow似乎对肽的真正含义并不清楚。许多肽...