亚马逊AWS官方博客 ·

基于 AWS 构建音视频直播审核方案

💡 原文中文，约8900字，阅读约需22分钟。

📝

内容提要

随着用户生成内容（UGC）的增加，音视频内容审核变得尤为重要。企业面临审核的准确性、实时性和成本等挑战。本文介绍了一种基于亚马逊云服务和开源项目的高效音视频审核解决方案，涵盖直播和存量内容审核，利用机器学习和无服务器架构，确保高可用性和灵活性。

🎯

🔎

随着用户生成内容（UGC）的激增，音视频内容的审核变得至关重要。企业需要确保内容的合规性，以维护平台的安全性和用户体验。实时审核不仅能降低违规内容的传播风险，还能提升用户对平台的信任度。

本文介绍的审核方案基于无服务器架构，利用AWS的多种服务，提供了高可用性和灵活性。企业可以根据实际需求调整资源配置，降低成本，同时确保系统在高并发情况下的稳定性。这种灵活性使得企业能够快速响应市场变化。

方案中采用了多种技术进行音视频审核，包括FFmpeg、Amazon Rekognition和大语言模型等。这种多样性使得审核过程更加全面，能够针对不同类型的内容进行精准审核。企业在选择技术时应考虑内容特性和审核需求，以实现最佳效果。

❓

随着用户生成内容（UGC）的增加，音视频内容审核变得尤为重要，以维护平台安全与用户体验。

该方案主要使用Amazon Rekognition、Amazon Bedrock、Amazon SageMaker等AWS服务，以及FFmpeg进行音视频处理。

实时直播审核通过提供播放链接，利用无服务器架构和AWS服务进行审核，支持快速获取审核结果。

音频审核首先将语音转换为文本，然后利用文本审核技术识别违规内容，通常使用SageMaker中的Whisper进行语音识别。

存量音视频审核通常针对已存储的内容，处理方式不同于实时直播审核，长视频和短视频采用不同的处理策略。

该方案采用无服务器架构，用户只需为实际用量付费，部分服务提供免费套餐，整体性价比高。

🏷️