小红花·文摘

本研究提出了一种灵活的框架，用于系统化评估基于大型语言模型的任务导向对话系统。该框架比较不同用户模拟器与对话系统的组合，分析架构、规模和提示策略对对话性能的影响，为构建高效的会话人工智能系统提供指导。