小红花·文摘 - 小红花技术领袖俱乐部

本研究提出CAFES框架，旨在提升自动作文评分的评估泛化性和多模态感知能力。通过协作多智能体的方式，显著提高了评分与人类判断的一致性，实验结果显示评分准确性提升了21%。

CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring

BriefGPT - AI 论文速递 ·

本文提出了一种新的零-shot自动化作文评分方法——比较作文评分（LCES），旨在解决模型偏差和评分不一致的问题。通过成对比较任务，LCES 提高了评分的准确性和可扩展性，实验结果表明其优于传统评分方法。

LCES: A Zero-Shot Automated Essay Scoring Method Based on Large Language Models

BriefGPT - AI 论文速递 ·