小红花·文摘

本研究提出了一种基于特定问题评分标准的多代理方法，以改善大语言模型在代码评估中的应用。通过引入新数据集和评估指标，该方法提高了逻辑评估的准确性，并提供了与教学目标一致的反馈。