MMLU-Pro 基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署
💡
原文中文,约4200字,阅读约需10分钟。
📝
内容提要
滑铁卢大学、多伦多大学和卡内基梅隆大学的研究人员联合发布了MMLU-Pro数据集,用于评估大语言模型的能力。该数据集包含来自多个来源的问题,旨在更严格地测试大型语言模型的功能。该数据集已在hyper.ai提供下载。
🎯
关键要点
- 滑铁卢大学、多伦多大学和卡内基梅隆大学联合发布了MMLU-Pro数据集。
- MMLU-Pro数据集旨在更严格地评估大型语言模型的能力,包含来自多个来源的复杂问题。
- 该数据集现已在hyper.ai提供下载。
- MMLU-Pro数据集包含12K个跨学科的复杂问题。
- hyper.ai官网更新了多个优质公共数据集和教程。
- 公共数据集包括DeepGlobe18、OpenForensics、DeepfakeTIMIT等。
- 社区文章精选涉及人脸识别、苹果新品发布、蛋白质同源物检测等主题。
- HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富的公共资源。
➡️