美团技术团队 ·

KuiTest：基于大模型通识的 UI 交互遍历测试

💡 原文中文，约5900字，阅读约需14分钟。

📝

内容提要

美团推出KuiTest，利用大语言模型自动验证UI交互，提升测试效率和覆盖率，显著降低人工成本并提高缺陷识别能力。

🎯

🔎

传统的UI功能测试依赖人工编写测试脚本，虽然精确，但成本高且维护困难。随着应用功能复杂化，测试脚本常常失效，导致测试效率低下。KuiTest的推出，正是为了解决这一问题，通过模拟用户预期，提升测试的自动化程度和覆盖率，降低人工成本。

KuiTest利用大语言模型的通用知识，能够理解UI交互的常识性预期，从而自动判断交互是否正确。这种无规则的测试方法，不仅减少了人工干预，还能适应不同平台的UI差异，提升了测试的灵活性和效率。

目前KuiTest主要聚焦于单步交互的功能验证，未来应扩展到多步交互场景，以应对复杂功能Bug的检测需求。通过建立状态追踪机制和因果关系链，能够更有效地定位长链路交互中的问题，提升测试的全面性和准确性。

❓

KuiTest 是美团推出的一套基于大语言模型的无规则 UI 功能测试系统，旨在自动验证用户界面的交互。

KuiTest 通过模拟用户预期，自动校验界面反馈，减少了人工编写测试脚本的需求，从而提升了测试效率和覆盖率。

传统 UI 测试依赖人工编写测试脚本，成本高且维护困难，且在界面频繁调整时常常失效。

KuiTest 已在美团多个业务中应用，发现了百余例有效的 UI 功能缺陷，显著降低了人工成本。

实验结果表明，KuiTest 在 UI 功能测试中具有高召回率和低误报率，证明了其有效性和可靠性。

未来研究将扩展到多步交互场景，提升复杂功能 Bug 的检测能力，探索状态追踪机制和因果推断能力。

🏷️