领域特定性在语言模型和生物医学关系抽取的指导有多重要?
原文中文,约500字,阅读约需2分钟。发表于: 。通过现有语言模型、测试四个数据集,我们的研究表明,在生物医学 NLP 任务(关系提取)中,虽然一般领域的模型通常优于生物医学领域的模型,但生物医学数据集上的 fine-tuning 可以与一般数据集 fine-tuning 达到类似的效果,提示将研究重点放在大规模生物医学数据集 fine-tuning 上,而非构建特定领域的生物医学语言模型。
研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在具有较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。