BriefGPT - AI 论文速递 ·

利用大型语言模型增强生成单元测试的可理解性

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文介绍了一种基于Transformer模型的单元测试生成方法，实验证明其在准确性和覆盖率上有显著提升，覆盖率达到93.1%。研究还探讨了不同代码生成模型的效果，发现Codex在某些数据集上表现良好。通过使用大型语言模型（LLMs），提出了新的测试生成方案，提升了测试质量和效率。

🎯

❓

可以通过基于Transformer模型的方法生成准确和有用的assert语句，支持开发人员编写单元测试用例。

实验证明，该模型的测试覆盖率达到了93.1%。

Codex模型在HumanEval数据集中可以达到80%以上的覆盖率，但在EvoSuite基准测试中表现不佳，覆盖率未超过2%。

自动生成测试用例可以降低软件测试的成本，提高测试质量和效率。

测试人员对生成的测试套件的理解持怀疑态度，相比手动设计的测试套件更不易接受。

可以通过将测试人员的互动可读性评估纳入测试生成工具，选择和呈现中间结果的策略来提高可读性。

🏷️