Automating Autograding: Large Language Models as Test Suite Generators for Introductory Programming

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了利用大型语言模型(LLMs)自动生成编程作业的测试套件,以提高教师效率。评估结果显示,LLM生成的测试套件能够有效识别有效解决方案,其全面性与教师创建的测试套件相当,同时揭示了问题陈述中的模糊性,提升了自动评分和教学设计的潜力。

🎯

关键要点

  • 本研究探讨了利用大型语言模型(LLMs)自动生成编程作业的测试套件,以提高教师效率。

  • LLM生成的测试套件能够有效识别大部分有效解决方案,其全面性与教师创建的测试套件相当。

  • 研究揭示了问题陈述中的模糊性,提升了自动评分和教学设计的潜力。

  • 自动评分编程作业可以为学生提供即时反馈,显著减少教师的手动评分时间。

➡️

继续阅读