The TensorFlow Blog ·

使用TF和GKE进行服务：稳定扩散

💡 原文英文，约3100词，阅读约需11分钟。

📝

内容提要

本文介绍了如何使用TensorFlow Serving和Google Kubernetes Engine在线部署生成式AI模型Stable Diffusion。通过将每个组件打包到单独的容器中，可以更好地控制本地计算能力和微调性质。文章还介绍了如何将Stable Diffusion包装为SavedModels，并在GKE集群上部署。最后，文章展示了如何通过RestAPI调用端点生成图像。需要注意的是，为了将tokenizer嵌入到Text Encoder本身中，需要为所选提示准备令牌。最终，我们可以通过将像素值转换为图像格式来绘制生成的图像。

🎯

关键要点

本文介绍了如何使用TensorFlow Serving和Google Kubernetes Engine在线部署生成式AI模型Stable Diffusion。
Stable Diffusion允许用户从自然语言文本提示生成高质量图像，适用于多个行业的不同用例。
Stable Diffusion由三个子模型组成：文本编码器、扩散模型和变分自编码器解码器。
每个组件可以独立服务，以便更好地利用资源，文本编码器可以在中等CPU上运行，而其他两个模型则需要GPU。
Stable Diffusion的每个组件被打包到单独的容器中，以便在GKE集群上运行，提供更好的控制和微调能力。
为了使用TensorFlow Serving，Stable Diffusion模型需要以SavedModel格式保存，并包含输入签名和预处理操作。
在GKE上部署Stable Diffusion需要编写Dockerfile、创建集群、安装NVIDIA驱动程序，并应用部署清单。
生成图像的过程包括准备提示的令牌、调用文本编码器、扩散模型和解码器的API端点。
需要注意的是，生成图像时，必须将像素值转换为图像格式以进行可视化。
通过XLA编译可以提高SavedModel的运行速度，适合部署使用。

🏷️

继续阅读

让 Amazon Quick 操作飞书：构建远程 MCP 服务的设计实践
本文探讨了如何利用AWS Bedrock AgentCore构建Amazon Quick与飞书的远程MCP服务，提出了按需编排、分层注册和Token安全的...
2026年实时音视频如何重塑”一起冥想”体验：纯净人声、空间音效与AI引导的技术落地
“一起冥想”是一款多人在线同步冥想应用，基于ZEGO的低延迟音视频技术，提供清晰的人声、沉浸式音效和实时互动。用户可通过AI降噪和3D音效在虚拟空间中体验...
行业财报 | 康卡斯特、迪士尼、派拉蒙、索尼音乐、环球音乐、腾讯音乐等17家媒体电影音乐公司2026年第一季度业绩汇总
2026年第一季度，康卡斯特、迪士尼、奈飞等媒体公司业绩增长。迪士尼营收251.68亿美元，同比增长7%；奈飞营收122.5亿美元，净利润52.83亿美元...
充满有趣问题的池塘
成功企业的乐趣在于专注于感兴趣的问题，同时满足业务需求。作者提到云端迁移、与苹果的冲突及开发Omarchy的经历，强调团队的力量使他能专注于有趣的项目。成...
腾讯云618活动上线：99元/年版境外CN2服务器补货另有3年超低价服务器
腾讯云618年中促销活动上线，推出99元/年境外轻量应用服务器，支持多地区选择。还有199元/年和3年528元的高配服务器可选，适合长期使用。活动期间提供...
让原生体验「接地气」：Pixel Text 与「原点系列」工具集
本文介绍了开发者推出的应用Pixel Text，旨在改善原生短信体验。该应用提炼短信中的关键信息，如验证码和取件码，减少用户查找成本。同时，通过本地模型识...

使用TF和GKE进行服务：稳定扩散

内容提要

关键要点

标签

继续阅读