小红花·文摘 - 小红花技术领袖俱乐部

研究表明，AI模型在接触低质量数据后会出现不可逆的“脑损伤”，导致推理和记忆能力显著下降。即使后续使用高质量数据训练，模型性能也无法完全恢复。这一现象与人类因接触碎片化信息导致的认知衰退相似，凸显了数据质量对AI发展的重要性。

垃圾信息刷多了AI也会变蠢！“年度最令人不安的论文”

量子位 ·

本研究提出了一种基于离线强化学习的微电网电压调节新方法，利用现有数据集进行模型训练。实验结果表明，该方法在不同数据集上表现出色，尤其在低质量数据集上具有良好效果，展现出重要的应用潜力。

微电网电压调节的离线强化学习

BriefGPT - AI 论文速递 ·

本研究提出了一种去噪分数蒸馏（DSD）方法，旨在提升扩散模型在低质量数据下的生成性能。通过在噪声样本上预训练并蒸馏为一步生成器，DSD显著改善了生成样本的质量。

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

BriefGPT - AI 论文速递 ·

数据不够致Scaling Law撞墙？CMU和DeepMind新方法可让VLM自己生成记忆

数据不够致Scaling Law撞墙？CMU和DeepMind新方法可让VLM自己生成记忆

机器之心 ·