小红花·文摘

Apple Machine Learning Research ·

本文探讨了文本生成系统的评估指标，提出了基于语义的MoverScore，并验证了其在多任务中的优越性。研究还介绍了无监督评估方法和Word Mover's Distance及其在图像字幕中的应用，强调了新度量标准与人类评估的相关性。

BriefGPT - AI 论文速递 ·