LessLeak-Bench: A First Study on Data Leakage in Large Language Models Across 83 Software Engineering Benchmarks
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究首次分析了大规模语言模型(LLMs)在83个软件工程基准中的数据泄露问题。尽管总体泄露率较低,但部分基准的泄露率显著较高,影响评估结果。为此,提出了新的基准LessLeak-Bench,以提高未来研究的可靠性。
🎯
关键要点
- 本研究首次分析了大规模语言模型(LLMs)在83个软件工程基准中的数据泄露问题。
- 尽管总体泄露率较低,但部分基准的泄露率显著较高,影响评估结果。
- 为了解决数据泄露问题,提出了新的基准LessLeak-Bench,以提高未来研究的可靠性。
🏷️
标签
➡️