BaxBench: Can Large Language Models Generate Correct and Secure Backends?

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了大语言模型(LLMs)在自动生成高质量后端应用程序时的功能性和安全性问题。BaxBench评估基准显示,LLMs的代码正确率仅为60%,且普遍存在安全漏洞,为更安全的软件开发提供了重要参考。

🎯

关键要点

  • 本研究探讨了大语言模型(LLMs)在自动生成高质量后端应用程序时的功能性和安全性问题。
  • BaxBench评估基准包含392项任务,验证生成应用程序的功能和安全性。
  • LLMs的代码正确率仅为60%,显示出其在生成代码方面的局限性。
  • 研究发现LLMs普遍存在安全漏洞,为更安全的软件开发提供了重要参考。
➡️

继续阅读