小红花·文摘

Stella：具有个性的开源AI测试代理

DEV Community ·

本研究解决了如何将大型语言模型（LLMs）有效用于自动化短答案评分（ASAG）任务的挑战。提出的SteLLA系统利用检索增强生成（RAG）方法，从教师提供的参考答案和评分标准中提取结构化信息，并对学生答案进行基于结构的评估，提供分析性评分和反馈。实验结果表明，SteLLA在与人工评分者的一致性方面表现显著，并对评分过程中生成的反馈进行了定性和错误分析，揭示了LLMs在ASAG系统中的潜在应用价值。

SteLLA：基于大型语言模型和检索增强生成的结构化评分系统

BriefGPT - AI 论文速递 ·

2025年信息检索的最佳嵌入模型

DEV Community ·