该文介绍了一种新的Transformer架构,包括条件注意机制和任务条件模块,以促进权重共享和减少数据不平衡的负面影响。该模型在GLUE和26个NLP任务中表现出了最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。