小红花·文摘

本研究提出了MedArabiQ基准数据集，涵盖七个阿拉伯医疗任务，旨在解决大型语言模型在阿拉伯医疗领域应用不足的问题。通过评估多个顶尖模型，强调创建高质量基准的重要性，以确保公平部署和扩展性。