DEV Community ·

自动测试生成：比较传统方法与基于人工智能的方法

💡 原文约700字/词，阅读约需3分钟。

📝

内容提要

文章《TestWars》比较了三种自动测试生成策略，结果显示EvoSuite和Kex在编译成功率和代码覆盖率方面优于基于大型语言模型（LLMs）的TestSpark。尽管LLMs工具越来越普及，传统方法仍然更有效，人类指导在测试生成中至关重要。

🎯

🔎

尽管大型语言模型（LLMs）在自动测试生成中越来越流行，但研究表明，传统方法如EvoSuite和Kex在编译成功率和代码覆盖率方面表现更佳。这提示开发者在选择工具时，仍需优先考虑传统方法的有效性，尤其是在关键项目中。

文章强调人类在测试生成中的指导作用，尤其是在定义测试目标和提供上下文信息方面。开发者应重视这一点，通过提供清晰的需求和背景信息，来提升自动生成测试的质量和有效性。

虽然LLMs在某些复杂任务中表现出色，但在自动测试生成中，它们的输出质量常常受到训练数据的影响，可能导致生成的测试质量较差。因此，开发者在使用LLMs时需谨慎，避免完全依赖其自动化能力。

❓

主要方法包括基于搜索的系统测试（SBST）、符号执行和基于大型语言模型（LLMs）的方法。

EvoSuite和Kex在编译成功率和代码覆盖率方面优于基于LLMs的TestSpark。

人类指导在定义测试目标和提供上下文方面至关重要，能够提高生成测试的有效性。

基于LLMs的工具常常生成质量较差的测试，且在重现已知错误方面表现最差。

未来需要结合传统技术和AI技术，继续改进自动测试生成的方法。

尽管LLMs工具越来越普及，传统方法在许多情况下仍然更有效，且人类指导不可或缺。

🏷️