AutoPatchBench是一个标准化基准,用于评估LLM代理在C/C++代码中自动修补安全漏洞的能力。它包含136个样本,基于Google的OSS-Fuzz数据集,专注于模糊测试发现的漏洞。AutoPatchBench-Lite是一个更小的子集,适合早期开发工具。该基准有助于理解AI修补能力,并支持开源项目。
AutoPatchBench是一个基准测试,旨在自动修复模糊测试发现的C/C++漏洞,包含136个真实漏洞及其验证修复,促进安全解决方案的开发与社区合作。该基准提供标准化评估框架,提高研究的透明度和可重复性。
完成下面两步后,将自动完成登录并继续当前操作。