小红花·文摘

本研究探讨了扩散模型的记忆行为及其影响因素，发现数据分布、模型配置和训练过程显著影响模型输出。提出了一种高效的数据归因方法，以提高扩散模型的可解释性和可控性。研究表明，合成数据在分类性能上不如真实数据，扩散模型在复制训练数据分布方面仍需改进。

BriefGPT - AI 论文速递 ·

该研究比较了合成面部识别数据集和真实数据集的多样性，并探讨了生成模型的训练数据分布对合成数据分布的影响。结果表明，生成器生成的属性与训练数据相似，但存在偏差。较低的内部一致性有助于减少偏差。

BriefGPT - AI 论文速递 ·