InfoQ ·

Meta详细介绍了GEM广告模型，采用大规模LLM训练、混合并行和知识转移

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

Meta推出生成广告模型(GEM)，旨在提升广告推荐效果。该模型通过处理大量用户与广告的互动，解决推荐系统的挑战。GEM利用先进架构、知识转移和优化训练基础设施，提高性能，并支持广告主目标与用户行为。Meta还采用多种并行策略和GPU优化，提升训练效率，帮助广告主实现更精准的广告投放。

🎯

关键要点

Meta推出生成广告模型(GEM)，旨在提升广告推荐效果。
GEM通过处理大量用户与广告的互动，解决推荐系统的挑战。
该模型利用先进架构、知识转移和优化训练基础设施，提高性能。
Meta采用多种并行策略和GPU优化，提升训练效率。
GEM的训练堆栈经过重新设计，以支持大规模基础模型训练。
Meta实施了多维并行策略，优化内存使用和减少通信成本。
通过GPU级优化，Meta减少了训练瓶颈和作业启动时间。
GEM支持轻量级模型变体，降低实验成本。
Meta设计GEM以将知识转移到多个用户导向的垂直模型。
直接转移和层次转移是GEM的两种知识转移策略。
GEM的有效FLOPs提升被认为是改变经济学的重要因素。
Meta希望广告推荐系统的基础模型能更深入理解用户偏好和意图。

❓

延伸问答

GEM广告模型的主要目标是什么？

GEM广告模型旨在提升广告推荐效果。

Meta是如何提高GEM模型的训练效率的？

Meta通过多种并行策略和GPU优化来提升GEM模型的训练效率。

GEM模型采用了哪些知识转移策略？

GEM模型采用直接转移和层次转移两种知识转移策略。

GEM模型如何处理用户与广告的互动数据？

GEM模型通过处理大量用户与广告的互动，解决推荐系统的挑战。

GEM模型的有效FLOPs提升有什么重要意义？

GEM模型的有效FLOPs提升被认为是改变经济学的重要因素。

Meta对广告主的期望是什么？

Meta希望广告推荐系统的基础模型能更深入理解用户偏好和意图。

🏷️

继续阅读

Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
有网友在谷歌搜索Codex被恶意广告欺骗带毒版直接窃取2万美元的加密货币
近期有网友在谷歌搜索Codex时被骗，损失高达2万美元的加密货币。攻击者利用谷歌商家域名创建钓鱼网站，诱导用户执行恶意安装命令，导致用户剪贴板内容被替换。...
Brave浏览器推出官方去广告版售价59.99美元(买断) 可禁用内置的各类广告功能
Brave 浏览器推出付费精简版 Origin，售价 59.99 美元，去除广告和盈利功能，支持最多 10 台设备同步。Linux 用户可免费使用，但在其...
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...