The New Stack ·

你的大型语言模型如何悄然虚构公司收入

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

大型语言模型（LLMs）在数据库工作中容易出错，生成的SQL查询可能执行成功但结果错误。由于SQL方言差异和人类沟通的模糊性，LLMs常缺乏必要的上下文。为此，开发了Model Context Protocol（MCP）和AGENTS.md等方法，以提供个性化上下文，提升查询准确性。

🎯

关键要点

大型语言模型（LLMs）在数据库工作中容易出错，生成的SQL查询可能执行成功但结果错误。
LLMs生成的SQL查询缺乏必要的上下文，导致语义正确性问题。
分析显示，大多数“错误”查询实际上执行成功，但返回的数据可能完全错误。
LLMs在处理数据库时容易受到SQL方言差异、混乱的现实世界数据和人类沟通模糊性的影响。
为了解决上下文问题，开发了Model Context Protocol（MCP）和AGENTS.md等方法。
MCP允许LLMs与数据库直接交互，提供结构化工具访问。
AGENTS.md通过Markdown文件嵌入上下文，便于文档化架构约定和业务逻辑。
Agent Skills提供模块化的上下文加载，允许按需调用知识。
Vercel的评估显示，AGENTS.md在框架文档中表现优于Agent Skills。
未来LLMs可能会在工具调用能力上有所改进，但尚不清楚哪种方法将成为主流。

❓

延伸问答

大型语言模型在数据库工作中常见的错误是什么？

大型语言模型生成的SQL查询可能执行成功但结果错误，导致语义正确性问题。

为什么大型语言模型在处理SQL时容易出错？

因为SQL方言差异、混乱的现实世界数据和人类沟通的模糊性使得LLMs缺乏必要的上下文。

Model Context Protocol（MCP）有什么作用？

MCP允许大型语言模型与数据库直接交互，提供结构化工具访问以提升查询准确性。

AGENTS.md如何帮助大型语言模型？

AGENTS.md通过Markdown文件嵌入上下文，便于文档化架构约定和业务逻辑，提升查询的准确性。

Agent Skills与AGENTS.md有什么区别？

Agent Skills提供模块化的上下文加载，允许按需调用知识，而AGENTS.md是一个单一的Markdown文件，始终加载全部内容。

未来大型语言模型在工具调用能力上可能会有什么改进？

未来大型语言模型可能会在工具调用能力上有所改进，但尚不清楚哪种方法将成为主流。

🏷️

继续阅读

Load Balancing and Scaling LLM Serving
负载均衡在大型语言模型（LLM）中与传统服务不同，主要由于提示缓存的存在。提示缓存能显著降低输入成本和延迟，但需要优化请求路由。文章探讨了缓存感知路由策略...
7 Steps to Mastering Language Model Deployment
部署大型语言模型（LLM）面临的挑战包括确保系统在真实环境中的可靠性和可扩展性。关键步骤有明确用例、选择合适模型、设计系统架构、添加安全层、优化延迟和成本...
早报｜手机销量十季度首降，三星苹果成唯二赢家/李想：不招非原生AI人才/苹果将Siri程序员送进AI「训练营」
· CEO 亲自上阵，小扎被曝搬工位与 Meta AI 团队一起写代码 · 李飞飞团队发布最新成果 Spark 2.0，手机浏览器可流畅渲染亿级粒子 3D...
PARA Org-mode 测试配置
本文介绍了如何在 Emacs 中配置和测试 PARA 方法，包括创建目录结构、加载配置、测试 org-capture、org-refile 和 agend...
AI 越强越需要你盯着——反馈循环实操指南
原文：[[https://www.jdon.com/91433-ai-human-taste-feedback-loop.html][OpenClaw之父...
Rainbow Cloud：亚太多地VPS钜惠，$15/月起！含香港、台湾、日本CN2、南非CN2优质线路，标配500G大流量。
Rainbow Cloud是一家香港的云服务商，提供亚太地区的VPS服务，价格从每月15美元起。其服务覆盖香港、台湾、日本和南非，采用CN2优化线路，适合...