路边的阿不 ·

在本地跑一个AI模型(7) - 你打草稿，模型来画

💡 原文中文，约6000字，阅读约需15分钟。

📝

内容提要

本文介绍了两种控制图像生成过程的技术：基于神经网络的ControlNet和基于提示嵌入的Adapter。文章还讨论了CannyDetector和HEDdetector等不同的Detector模型，用于生成引导图。最后，文章展示了使用ControlNet和Adapter生成的图像对比。

🎯

关键要点

本文介绍了两种控制图像生成过程的技术：ControlNet和Adapter。
ControlNet基于神经网络，通过学习图像和文本描述之间的关系来引导图像生成。
Adapter基于提示嵌入，将文本提示转换为向量表示，并与图像嵌入结合以引导图像生成。
ControlNet的优点是效果好、可控性强，但使用复杂，需要训练数据；Adapter易于使用、灵活，但效果可能不佳。
使用Detector模型生成引导图，常见的有CannyDetector、HEDdetector、LineartDetector等。
CannyDetector用于提取图像边缘信息，HEDdetector适用于更复杂的边缘，LineartDetector用于线条艺术。
MidasDetector估计物体深度，NormalBaeDetector估计表面法线，OpenposeDetector检测人体关键点。
使用ControlNet和Adapter生成图像时，需要下载相应的模型并编写代码进行测试。
文章展示了使用不同Detector和ControlNet、Adapter生成的图像对比。

❓

延伸问答

ControlNet和Adapter有什么区别？

ControlNet基于神经网络，效果好且可控性强，但使用复杂；Adapter基于提示嵌入，易于使用但效果可能不佳。

如何使用CannyDetector生成引导图？

需要下载CannyDetector模型，并使用相应的代码加载图像进行边缘检测，提取边缘信息。

什么是引导图，它的作用是什么？

引导图是通过分析图像提取特定信息，帮助控制图像生成过程，使生成的图像更符合预期。

使用ControlNet生成图像需要哪些步骤？

首先下载ControlNet模型，然后编写代码加载图像和生成引导图，最后调用生成函数生成图像。

HEDdetector与CannyDetector有什么不同？

HEDdetector能够检测更复杂的边缘，而CannyDetector主要用于提取简单的边缘信息。

Adapter的优缺点是什么？

Adapter的优点是易于使用和灵活，缺点是效果可能不佳，需要额外的训练数据。

🏷️

标签

Adapter ControlNet ai 控制图像生成提示嵌入神经网络

➡️

继续阅读

开源工具curl v8.21.0版发布修复18个安全漏洞多数都是AI模型发现的
开源工具curl发布了v8.21.0版本，修复了18个安全漏洞，创下单次修复记录。新版本增强了对HTTP/3的支持、SSH安全性和Cookie处理。开发者...
生成式 AI 给邮件营销提效：从写模板到质量把关的自动化闭环
生成式AI通过优化模板和全生命周期跟踪，提升邮件营销效率，实现营销闭环。SES Sender平台在AWS上自托管，支持AI模板创作、质量把关及合规管理，降...
Jan Wieremjewicz：为什么PostgreSQL需要制定AI使用政策
PostgreSQL需要制定AI使用政策，以应对AI生成内容对开源项目的影响。虽然AI简化了提交流程，但也可能导致低质量提交，增加维护者负担。许多开源项目...
AI 编程=控制系统：BeecodeAI 的设计原理
这篇文章探讨了将 AI 编程视为控制系统的设计原理，强调验证和协调的重要性，而非仅仅生成代码。介绍了 beecodeai 产品如何通过任务管理、反馈回路和...
剧星传媒与火山引擎达成合作，共同探索AI赋能营销的未来
剧星传媒与火山引擎达成合作，旨在探索AI赋能营销的未来。火山引擎将提供技术支持，提升剧星传媒的营销智能化服务能力，利用AI技术和云基础设施强化其AI系统，...
华为AI眼镜获SGS全球首张佩戴舒适性Premium Performance Mark
华为AI眼镜在2026上海世界移动通讯展上获得SGS颁发的全球首张佩戴舒适性Premium Performance Mark，体现其在佩戴舒适性方面的卓越...