小红花·文摘

全球TMT-美通国际 ·

本文提出了一种新的零-shot自动化作文评分方法——比较作文评分（LCES），旨在解决模型偏差和评分不一致的问题。通过成对比较任务，LCES 提高了评分的准确性和可扩展性，实验结果表明其优于传统评分方法。

BriefGPT - AI 论文速递 ·

本研究提出了一种新的“排名后评分”（RTS）框架，以提升大型语言模型在自动化论文评分中的表现。实验结果表明，该框架通过数据微调和特征丰富，优于传统方法，尤其在中文论文评分中效果显著。

BriefGPT - AI 论文速递 ·

本研究提出了一种语法感知的跨提示特征评分方法（GAPS），有效解决了自动化作文评分中的跨提示问题。该方法利用语法错误修正技术，捕捉无关的句法特征，显著提升了提示无关和语法相关特征的评分效果，尤其在跨提示场景中表现优异。

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型的可解释性和实用性，提出了自动化评分系统GEN-U来评估其帮助性。研究发现，众包工作者更倾向于基于知识的解释，尽管模型生成的解释更受欢迎，但需提升简明性和新颖性。研究旨在提高生成解释的可信度。

BriefGPT - AI 论文速递 ·