LongBoX:评估基于 Transformer 的长序列临床任务

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

研究评估了大型语言模型(LLMs)在生物医学任务中的性能,发现LLMs在较小训练集的生物医学数据集中表现出色,甚至超过了当前最先进的生物医学模型。然而,不同的LLMs在不同任务中表现不同。尽管与精细调整的生物医学模型相比,LLMs的性能仍有待提高,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

原文中文,约500字,阅读约需2分钟。
阅读原文