BriefGPT - AI 论文速递 ·

大规模语言模型的基于令牌的影响训练数据检索

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

本文介绍了DataInf，一种高效的影响力近似计算方法，适用于大规模生成型AI模型。DataInf在计算和内存效率上优于现有算法，特别适合LoRA等微调技术。实证评估表明，DataInf能够准确识别影响最大的微调示例，并帮助发现错误标记的数据点。

🎯

DataInf 是一种高效的影响力近似计算方法，适用于大规模生成型 AI 模型。
DataInf 在计算和内存效率上优于现有的影响力计算算法，特别适合 LoRA 等微调技术。
实证评估表明，DataInf 能够准确识别影响最大的微调示例，并帮助发现错误标记的数据点。
在 RoBERTa-large、Llama-2-13B-chat 和 stable-diffusion-v1.5 模型中，DataInf 的表现优于其他近似影响力分数的方法。

❓

DataInf 是一种高效的影响力近似计算方法，适用于大规模生成型 AI 模型。

DataInf 在计算和内存效率上优于现有的影响力计算算法，特别适合 LoRA 等微调技术。

DataInf 能够准确识别影响最大的微调示例，从而帮助发现错误标记的数据点。

DataInf 在 RoBERTa-large、Llama-2-13B-chat 和 stable-diffusion-v1.5 模型中表现优于其他方法。

实证评估表明，DataInf 能够准确近似影响力分数，并且比现有方法快几个数量级。

DataInf 特别适用于 LoRA 等参数效率高的微调技术。

🏷️