实时互动网 ·

Meta AI 发布 Llama Guard 3-1B-INT4：用于人机对话的紧凑型高性能 AI 调节模型

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

Meta推出了Llama Guard 3-1B-INT4模型，以应对生成式人工智能系统在内容安全方面的挑战。该模型体积小、性能强，适合移动设备，具备出色的多语言能力和安全审核功能，标志着生成式AI安全审核的重大进展。

🎯

🔎

生成式人工智能在提供创新功能的同时，也面临着生成不安全或违反政策内容的风险。Llama Guard 3-1B-INT4模型的推出，正是为了应对这一挑战，确保生成内容的安全性和合规性。随着技术的发展，如何有效地审查和过滤生成内容将成为未来AI应用的重要课题。

Llama Guard 3-1B-INT4模型的体积仅为440MB，适合在资源受限的移动设备上运行。这一特性使得其在实际应用中具有广泛的潜力，尤其是在智能手机等设备上。随着移动设备性能的提升，未来可能会有更多基于此类模型的应用出现，推动AI技术的普及。

该模型采用了先进的压缩技术，如解码器块修剪和量化感知训练，使得模型在保持高性能的同时显著减小了体积。这种技术的成功应用，不仅提升了模型的效率，也为其他大型语言模型的优化提供了借鉴，显示了在AI领域中压缩技术的重要性。

❓

该模型旨在应对生成式人工智能系统在内容安全方面的挑战，提供安全审核功能。

该模型体积为440MB，比前身小七倍，并在标准Android移动CPU上实现每秒至少30个令牌的吞吐量。

该模型在多语言能力方面表现与大型模型相当或更好，特别是在安全审核任务中超越GPT-4。

通过先进的压缩技术，如解码器块修剪、神经元级修剪和量化感知训练，实现了模型的压缩。

该模型保持强大的安全调节能力，在多语言数据集中平衡效率和有效性。

该模型适合在资源受限的移动设备上部署，提供安全的AI系统解决方案。

🏷️