本研究介绍了一种名为NuNER的紧凑语言表示模型,用于低数据需求的命名实体识别任务。研究发现,预训练数据集的大小和实体类型多样性是取得良好性能的关键。该模型在few-shot情景下胜过了类似大小的基础模型,并与更大的语言模型竞争。
深度学习网络在计算机视觉中成为标准,但在自然语言处理中,无参数模型可以作为低成本替代选择。研究发现,最近邻分类器与Gzip压缩工具相结合的模型在few-shot情景下准确性更高且占用空间更少。这突显了具有强归纳偏差的模型在few-shot情景中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。