本文提出了一种基于LLM4DV的创新基准测试方法,通过大型语言模型与提示模板的互动生成测试刺激。实验结果表明,LLM4DV在直接测试模块时优于传统的约束随机测试,但在复杂任务中效率有所下降。框架和模块将在发表后开源。
完成下面两步后,将自动完成登录并继续当前操作。