本研究提出了一种基于特定问题评分标准的多代理方法,以改善大语言模型在代码评估中的应用。通过引入新数据集和评估指标,该方法提高了逻辑评估的准确性,并提供了与教学目标一致的反馈。
完成下面两步后,将自动完成登录并继续当前操作。