SteLLA:基于大型语言模型和检索增强生成的结构化评分系统
📝
内容提要
本研究解决了如何将大型语言模型(LLMs)有效用于自动化短答案评分(ASAG)任务的挑战。提出的SteLLA系统利用检索增强生成(RAG)方法,从教师提供的参考答案和评分标准中提取结构化信息,并对学生答案进行基于结构的评估,提供分析性评分和反馈。实验结果表明,SteLLA在与人工评分者的一致性方面表现显著,并对评分过程中生成的反馈进行了定性和错误分析,揭示了LLMs在ASAG系统中的潜在应用价值。
🏷️
标签
➡️