随机循环向量的多标签学习
原文中文,约200字,阅读约需1分钟。发表于: 。通过使用随机循环向量作为输出层的表征,本文提出了一种改进的深度神经网络模型,用于解决极端多标签分类任务。在合成数据集和实际数据集上的实验证明,随机循环向量相对于随机实数向量具有更好的标签编码能力,能显著提高任务性能并减少输出层尺寸。
该论文介绍了XR-Transformer,一种用于加速transformer模型微调的新递归方法。在Amazon-3M数据集上,该方法实现了较快的训练速度,并将Precision@1从51%提高到54%,成为目前基于transformer的XMC模型中的最佳结果之一。