MedINST: Meta Dataset of Biomedical Instructions
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了MedINST,一个包含133个生物医学自然语言处理任务和超过700万训练样本的元数据集,旨在解决大型语言模型在医学分析中缺乏多样化数据集的问题。经过微调,多个模型在MedINST32基准上表现出更好的泛化能力。
🎯
关键要点
-
本研究提出了MedINST,一个包含133个生物医学自然语言处理任务的元数据集。
-
MedINST包含超过700万训练样本,旨在解决大型语言模型在医学分析中缺乏多样化数据集的问题。
-
经过微调,多个模型在MedINST32基准上表现出更好的泛化能力。
🏷️