从模型中心到人本中心:基于语言模型的应用中文本评估的修订距离度量

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文研究了与人类评价相关的度量标准,并提出了新的度量标准MoBERT。通过人类评价发现,目前用于此任务的度量标准与人类判断相关性较低,而常用的度量标准和坐标误差与人类判断相关性较高。不推荐使用一些最近开发的度量标准。结果显示,MoBERT在样本级别和模型级别上与人类判断相关性高,优于当前所有替代方案。

🎯

关键要点

  • 人们对从自然语言描述中生成基于骨架的人类动作越来越感兴趣。

  • 本文研究了与人类评价相关的度量标准,并提出了新的度量标准MoBERT。

  • 目前用于此任务的度量标准与人类判断相关性较低。

  • 常用的度量标准(如R-Precision)和坐标误差与人类判断相关性较高。

  • 不推荐使用一些最近开发的度量标准,因为它们与人类判断的相关性较低。

  • MoBERT在样本级别和模型级别上与人类判断相关性高,优于当前所有替代方案。

➡️

继续阅读