本文提出了一种新的时间行动定位(TAL)架构,通过特征聚合和循环机制,能够捕捉长距离依赖和时间因果关系。实验证明该方法在多个基准数据集上取得了优越结果,为未来的研究奠定了基础。
该文章提出了一种新的时间行动定位(TAL)架构,通过特征聚合和循环机制,能够捕捉长距离依赖和时间因果关系。实验证明该方法在多个基准数据集上取得了优越结果,为未来的研究奠定了基础。
Transformer-XL是一种新的神经架构,能够解决语言模型中的上下文破碎问题,通过分段级别的循环机制和新颖的位置编码方案,捕捉更长期的依赖关系。在评估期间,速度比普通的Transformers快1800多倍,并且在短序列和长序列上表现更好。实验结果显示,在多个语料库上,Transformer-XL表现更好。
完成下面两步后,将自动完成登录并继续当前操作。