AWS Architecture Blog ·

Synthesia如何在亚马逊EC2 G7e实例上优化生成AI视频推理

💡 原文英文，约2100词，阅读约需8分钟。

📝

内容提要

Synthesia通过亚马逊EC2 G7e实例优化生成AI视频推理，采用异步帧生成管道提高GPU利用率，减少8.2%的延迟。该技术利用双CUDA流和专用工作线程，消除传统同步解码中的GPU停滞，每千小时视频解码节省约896美元，适用于任何分块视频生成管道。

🎯

🔎

Synthesia采用的异步帧生成管道通过重叠GPU计算和数据传输，显著提高了GPU利用率。这种方法消除了传统同步解码中的GPU停滞，使得处理速度更快，延迟减少8.2%。对于需要高效视频生成的企业来说，这种技术能够有效降低成本并提升生产效率。

在G7e实例上，使用异步帧生成管道每千小时视频解码可节省约896美元。这一节省是基于GPU的高效利用而非模型优化，因此适用于任何分块视频生成管道。企业在选择视频生成解决方案时，应考虑这种技术带来的潜在经济效益。

异步帧生成管道不仅限于特定的模型或GPU架构，任何采用分块视频生成的工作流都可以受益于此技术。这意味着，无论是大型企业还是小型初创公司，都可以通过实施这一方法来提升视频生成的效率和质量。

❓

Synthesia通过在亚马逊EC2 G7e实例上采用异步帧生成管道来优化生成AI视频推理，提高GPU利用率并减少延迟。

异步帧生成管道通过重叠GPU计算、数据传输和主机侧后处理，消除传统同步解码中的GPU停滞。

G7e实例提供高达99.9%的GPU内核利用率，并能在每千小时视频解码中节省约896美元。

通过使用双CUDA流，异步帧生成管道允许GPU计算与数据传输并行进行，从而提高GPU利用率。

传统同步解码会导致GPU停滞，降低GPU利用率，增加处理时间。

该技术适用于任何分块视频生成管道，特别是需要将帧传输到主机内存的场景。

🏷️