本文研究了大型语言模型和仅编码器模型在处理包含习语的任务时的性能。结果显示,细调为特定任务的模型表现更好,尽管大型语言模型在不同尺度下都具有竞争力的性能。文章还讨论了增加模型规模以提高性能的可行性。
完成下面两步后,将自动完成登录并继续当前操作。