EssayJudge:评估多模态大型语言模型自动作文评分能力的多层次基准
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了EssayJudge,旨在解决传统自动作文评分系统的特征依赖性和多模态处理不足的问题。通过多模态大型语言模型,EssayJudge实现了更精确的上下文评估,推动了该领域的发展。
🎯
关键要点
- 本研究提出了EssayJudge,旨在解决传统自动作文评分系统的特征依赖性问题。
- EssayJudge 还解决了细微特质捕捉困难及多模态情境处理不足的问题。
- 通过利用多模态大型语言模型,EssayJudge 实现了更精确的上下文评估。
- 研究揭示了当前多模态大型语言模型在自动评分表现上的不足,特别是在话语层面特征上。
- 该研究推动了自动作文评分领域的进一步发展。
➡️