本研究解决了自动任务指导中的程序性错误检测问题,重点在于用户任务执行的分类。通过问答自对话形式提升透明度,并利用自然语言推理模型生成一致性指标,显著提高了模型性能和对话效率。
完成下面两步后,将自动完成登录并继续当前操作。