本文介绍了多种针对抽象意义表示(AMR)的新方法和度量标准,如 S$^2$match、SMARAGD 和 SEMBLEU。这些方法在 AMR 图的相似度计算、解析准确性和多语言句子嵌入性能方面表现出色,显示了在语义评估和生成文本质量评估中的潜力。研究表明,这些新指标和算法在控制偏差和提高准确性方面优于传统方法。
本研究提出了一种使用双向双编码器和加性边际 softmax 学习多语言句子嵌入的方法,能够在联合国平行语料库检索任务上取得最先进的结果,并使用检索到的语言对训练 NMT 模型。通过对句子嵌入平均构建的简单文档级别嵌入进行实验,能在 UN 文档级别检索任务中取得 97% 以上的 P@1。在 BUCC 挖掘任务上评估所提出的模型,与当前最先进的模型相比取得有竞争力的结果,并利用第二阶段的评分器在此任务上实现了新的最先进水平。
完成下面两步后,将自动完成登录并继续当前操作。