本文探讨了大型语言模型(LLMs)作为AI辅导员的有效性,提出了基于学习科学的评估分类法,并发布了MRBench评估基准,包含192个对话和1,596个响应,旨在评估AI辅导员的教学价值,促进其发展。
本研究提出了一种名为PROF的创新反馈方法,通过语言模型模拟学生修订,优化反馈生成。结果表明,PROF在提升学生写作能力方面优于多种基准方法,具有较高的教学价值。
完成下面两步后,将自动完成登录并继续当前操作。