本研究提出了MedArabiQ基准数据集,涵盖七个阿拉伯医疗任务,旨在解决大型语言模型在阿拉伯医疗领域应用不足的问题。通过评估多个顶尖模型,强调创建高质量基准的重要性,以确保公平部署和扩展性。
完成下面两步后,将自动完成登录并继续当前操作。