MedINST:生物医学指令的元数据集
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了大型语言模型在医学分析领域中缺乏大规模、多样化、良好注释数据集的问题。我们提出MedINST,一个包含133个生物医学自然语言处理任务及超过700万训练样本的多领域、多任务指令元数据集,旨在提升模型的跨任务泛化能力。经过在MedINST上的微调,多个大型语言模型在MedINST32基准上表现出更好的泛化能力。
本研究推出MedINST数据集,解决大型语言模型在医学分析中数据不足的问题。MedINST包含133个生物医学任务和超过700万训练样本,旨在提高模型的跨任务泛化能力。经过微调,多个模型在MedINST32基准上表现出更好的泛化能力。