MedINST: Meta Dataset of Biomedical Instructions

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了MedINST,一个包含133个生物医学自然语言处理任务和超过700万训练样本的元数据集,旨在解决大型语言模型在医学分析中缺乏多样化数据集的问题。经过微调,多个模型在MedINST32基准上表现出更好的泛化能力。

🎯

关键要点

  • 本研究提出了MedINST,一个包含133个生物医学自然语言处理任务的元数据集。

  • MedINST包含超过700万训练样本,旨在解决大型语言模型在医学分析中缺乏多样化数据集的问题。

  • 经过微调,多个模型在MedINST32基准上表现出更好的泛化能力。

🏷️

标签

➡️

继续阅读