DEV Community ·

生成AI 5：WGAN与WGAN-GP

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

GAN在生成模型中非常重要，但存在训练不稳定和梯度消失等问题。WGAN及其改进版WGAN-GP通过使用Wasserstein距离解决了这些问题，提供了更稳定的训练和更丰富的生成样本。WGAN-GP还引入了梯度惩罚，进一步提升了生成效果。

🎯

❓

WGAN使用Wasserstein距离作为损失函数，而传统GAN使用JS散度。WGAN的判别器称为评论家，评分数据的真实度，而不是简单分类。

Wasserstein距离用于测量生成数据与真实数据之间的距离，提供更稳定的训练信号，避免了传统JS散度导致的梯度消失问题。

WGAN-GP通过引入梯度惩罚来限制评论家的评分变化，进一步提升生成效果，解决了训练不稳定的问题。

WGAN可能会出现评论家放大输出导致生成器接收极端梯度的问题，从而引发训练不稳定和模式崩溃。

WGAN-GP的训练需要在每次生成器更新之间多次训练评论家，并且不应在评论家中使用批量归一化。

WGAN的缺点包括训练速度慢、内存使用高和对超参数敏感，需要仔细调整。

🏷️

在苹果新 CEO 上任前，我们和他聊了聊 AI 与 iPhone
当年 Ternus 没有回答的问题，现在该他回答了#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
AI抵制浪潮兴起：数据投毒与虚假信息如何反击模型训练
人们通过投喂垃圾数据和散布虚假信息来抵制AI数据抓取，旨在提高数据采集成本，迫使科技公司改变做法。Reddit社区“毒泉”鼓励用户向爬虫提供无用数据，以影...
AI产品竞争终局：上下文Context才是真正战场
AI的真正价值在于上下文，而非模型本身。企业在AI应用中失败，往往是因为未重视上下文的构建。有效使用AI需要将隐性知识结构化为可复用的技能框架，以提升团队...
Deezer表示AI歌曲上传量几乎超过人类音乐
Deezer表示，每天接收近75,000首AI生成歌曲，占所有上传的44%。尽管上传量激增，AI歌曲的播放量仅占1%至3%。Deezer已开始标记AI曲目...
《堡垒之夜》开发者现在可以创建AI角色——但请不要试图与他们约会
Epic Games在Fortnite中推出新的“对话”工具，允许开发者创建可与玩家互动的AI角色。该工具使用Google的Gemini 3.1模型处理音...
使用您的谷歌AI订阅在AI Studio中开始氛围编码。
谷歌AI Pro和Ultra订阅者在Google AI Studio中获得了更高的使用限制，并可访问Nano Banana Pro和Gemini Pro模...