Measure Zero ·

用 Pydantic 自动生成 LLM Tool Schema

💡 原文中文，约6700字，阅读约需16分钟。

📝

内容提要

使用 Pydantic 自动生成符合 OpenAI 规范的工具模式，简化工具描述的维护。通过定义模型实现参数校验和类型转换，支持嵌套模型和自定义校验逻辑。

🎯

🔎

使用 Pydantic 自动生成 Tool Schema 的最大优势在于简化了工具描述的维护工作。开发者无需引入额外库，减少了依赖和潜在的兼容性问题，同时利用 Pydantic 的参数校验和类型转换功能，提升了代码的可靠性和可读性。

通过定义嵌套模型和自定义校验逻辑，Pydantic 能够处理更复杂的场景。例如，SearchFilesArgs 模型展示了如何结合文件类型和时间范围进行搜索，这种灵活性使得开发者能够更好地封装业务规则，提升工具的功能性。

在使用 Pydantic 生成 Tool Schema 时，开发者需要注意模型的设计，确保字段的描述和类型定义准确无误。此外，处理来自 LLM 的 'null' 字符串输入时，需确保相关逻辑的正确性，以避免潜在的运行时错误。

❓

通过定义 Pydantic 模型并使用 model_json_schema 方法生成 JSON Schema，然后将其处理成符合 OpenAI 规范的 Tool Schema。

使用 Pydantic 可以避免引入其他库，简化工具描述的维护，并自动校验参数和转换类型。

例如，定义一个 GetWeatherArgs 类，包含 location 和 units 字段，并使用 create_tool_from_pydantic 函数生成工具定义。

可以通过定义嵌套模型和使用 Pydantic 的验证器来实现，例如在 SearchFilesArgs 模型中处理文件类型和创建时间的筛选。

LLMProofBaseModel 类自动处理来自 LLM 的 'null' 字符串输入，将其转换为 None。

可以在 TimeRange 模型中使用 model_validator 定义校验逻辑，确保开始日期不晚于结束日期。

🏷️