小红花·文摘

该研究使用信息论探测套件，分析了9项任务，发现语法知识在全面训练的0.5%后迅速获得，持续性能改善主要来自对开放域知识的获取，而语义和推理任务则受益于后期对长距离语境化和更高专业化的提升。跨任务相似性的测量揭示了语言相关任务在训练期间共享信息，这对模型可解释性、多任务学习和有限数据学习具有重要意义。