Stella是一个开源框架,利用AI代理作为测试人员,具备独特个性和测试协议,旨在解决传统测试中的管理和反馈问题,简化测试流程,使用MongoDB和Python技术。
本研究解决了如何将大型语言模型(LLMs)有效用于自动化短答案评分(ASAG)任务的挑战。提出的SteLLA系统利用检索增强生成(RAG)方法,从教师提供的参考答案和评分标准中提取结构化信息,并对学生答案进行基于结构的评估,提供分析性评分和反馈。实验结果表明,SteLLA在与人工评分者的一致性方面表现显著,并对评分过程中生成的反馈进行了定性和错误分析,揭示了LLMs在ASAG系统中的潜在应用价值。
最新发布的Voyage-3-large在嵌入相关性方面表现优异,超越其他模型,准确性领先。Voyage-3-lite性价比高,Stella是适合进一步微调的优秀开源选择。
完成下面两步后,将自动完成登录并继续当前操作。