从模型中心到人本中心:基于语言模型的应用中文本评估的修订距离度量
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文研究了与人类评价相关的度量标准,并提出了新的度量标准MoBERT。通过人类评价发现,目前用于此任务的度量标准与人类判断相关性较低,而常用的度量标准和坐标误差与人类判断相关性较高。不推荐使用一些最近开发的度量标准。结果显示,MoBERT在样本级别和模型级别上与人类判断相关性高,优于当前所有替代方案。
🎯
关键要点
-
人们对从自然语言描述中生成基于骨架的人类动作越来越感兴趣。
-
本文研究了与人类评价相关的度量标准,并提出了新的度量标准MoBERT。
-
目前用于此任务的度量标准与人类判断相关性较低。
-
常用的度量标准(如R-Precision)和坐标误差与人类判断相关性较高。
-
不推荐使用一些最近开发的度量标准,因为它们与人类判断的相关性较低。
-
MoBERT在样本级别和模型级别上与人类判断相关性高,优于当前所有替代方案。
➡️