小红花·文摘

本文提出了一种基于LLM4DV的创新基准测试方法，通过大型语言模型与提示模板的互动生成测试刺激。实验结果表明，LLM4DV在直接测试模块时优于传统的约束随机测试，但在复杂任务中效率有所下降。框架和模块将在发表后开源。