小红花·文摘

本研究解决了自动任务指导中的程序性错误检测问题，重点在于用户任务执行的分类。通过问答自对话形式提升透明度，并利用自然语言推理模型生成一致性指标，显著提高了模型性能和对话效率。