宝玉的分享 ·

我写了个 Skill，让 Agent 自动给文章配图

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

作者开发了一种Agent Skill，自动分析文章并生成插图，提升阅读体验。该Skill通过分析结构、匹配风格和生成提示词等步骤，快速完成配图。Agent Skills是将知识整理成可供Agent调用的“培训手册”，以提高工作效率。

🎯

🔎

Agent Skills不仅限于配图功能，它们可以被应用于多种任务，如自动生成周报或代码审查。这种灵活性使得用户能够将重复性工作转化为可自动化的流程，从而提高工作效率。

Skill的渐进式加载机制避免了上下文窗口的过载，使得Agent能够高效地管理和调用所需的知识。这种设计不仅提升了性能，还确保了信息的准确性和及时性。

在配图过程中，预设九种风格确保了视觉效果的一致性。风格的统一不仅提升了文章的整体美感，还帮助读者更好地理解内容，避免了因风格混乱而造成的认知负担。

❓

这个Agent Skill通过分析文章结构、匹配风格和生成提示词，自动识别需要配图的位置并生成插图，提升阅读体验。

SKILL.md文件是Agent Skill的核心，包含头部元信息和正文指令，用于指导Agent在何时调用该Skill及其具体操作。

配图Skill的设计包括分析文章结构、匹配插画风格、生成提示词、调用图像生成工具和插入图片等步骤。

Agent Skills采用渐进式加载机制，只在需要时加载具体内容，而传统提示词一次性加载全部，缺乏脚本执行能力。

用户可以通过命令告诉Agent安装配图Skill，并在需要时调用它来自动生成插图。

预设九种插画风格是为了保证风格一致性，避免图像风格混乱，同时也给用户提供选择的空间。

🏷️