小红花·文摘

本文介绍了DataInf，一种高效的影响力近似计算方法，适用于大规模生成型AI模型。DataInf在计算和内存效率上优于现有算法，特别适合LoRA等微调技术。实证评估表明，DataInf能够准确识别影响最大的微调示例，并帮助发现错误标记的数据点。

BriefGPT - AI 论文速递 ·

本文提出了一种新的监督学习方法，优化神经机器翻译性能，特别适用于从修改翻译中学习。研究表明，使用错误标记的标注模式能有效训练模型并提高信号强度。此外，探讨了自然语言推理中的错误与变异，提出了新数据集VariErr，发现GPT模型在错误检测上优于现有方法。

BriefGPT - AI 论文速递 ·

X/Twitter为用户提供敏感内容标记功能，最近大量用户发布的正常图片被错误标记为敏感内容，可能是垃圾账号/机器人导致的。X安全团队已解决问题，所有被标记的图片已恢复正常，用户无需额外操作。

蓝点网 ·