BriefGPT - AI 论文速递 ·

黑盒 LLM 的数据污染校准

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文探讨了大型语言模型中的数据污染问题，提出了有效的检测方法CDD和减轻方法TED。研究表明，数据污染显著影响模型性能，尤其在基准测试中。通过多项选择测验评估七个数据集的污染情况，结果显示污染现象普遍存在，影响了模型的准确性和可靠性。

🎯

❓

数据污染是指在大型语言模型的训练数据中，存在来自下游任务的测试数据，这会影响模型的有效性。

CDD是一种数据污染检测方法，而TED是一种减轻数据污染影响的方法，两者都能显著提升模型的准确度和性能。

研究表明，数据污染显著影响模型的准确性和可靠性，尤其在基准测试中表现突出。

通过多项选择测验评估数据集的污染情况，设计扰动版本的实例来检测模型的识别能力。

实验结果显示，CDD在准确度、F1得分和AUC指标方面平均提升了21.8%-30.2%，而TED成功减轻了性能下降高达66.9%。

在进行敏感数据的微调和部署之前，应谨慎处理隐私攻击的风险，以保护数据安全。

🏷️