LessLeak-Bench: A First Study on Data Leakage in Large Language Models Across 83 Software Engineering Benchmarks

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究首次分析了大规模语言模型(LLMs)在83个软件工程基准中的数据泄露问题。尽管总体泄露率较低,但部分基准的泄露率显著较高,影响评估结果。为此,提出了新的基准LessLeak-Bench,以提高未来研究的可靠性。

🎯

关键要点

  • 本研究首次分析了大规模语言模型(LLMs)在83个软件工程基准中的数据泄露问题。
  • 尽管总体泄露率较低,但部分基准的泄露率显著较高,影响评估结果。
  • 为了解决数据泄露问题,提出了新的基准LessLeak-Bench,以提高未来研究的可靠性。
➡️

继续阅读