神经机器翻译(NMT)模型中的多尺度上下文化(MSC)方法通过学习不同隐藏状态维度上的不同尺度的上下文化信息,并利用注意力模块动态地集成多尺度的上下文化信息,以解决子词标记化在复杂任务中的劣势。实验证明,MSC 在多语言和领域外的场景中明显优于子词和其他基于字节的方法。
完成下面两步后,将自动完成登录并继续当前操作。