MMLU-Pro 基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署

💡 原文中文,约4200字,阅读约需10分钟。
📝

内容提要

滑铁卢大学、多伦多大学和卡内基梅隆大学的研究人员联合发布了MMLU-Pro数据集,用于评估大语言模型的能力。该数据集包含来自多个来源的问题,旨在更严格地测试大型语言模型的功能。该数据集已在hyper.ai提供下载。

🎯

关键要点

  • 滑铁卢大学、多伦多大学和卡内基梅隆大学联合发布了MMLU-Pro数据集。
  • MMLU-Pro数据集旨在更严格地评估大型语言模型的能力,包含来自多个来源的复杂问题。
  • 该数据集现已在hyper.ai提供下载。
  • MMLU-Pro数据集包含12K个跨学科的复杂问题。
  • hyper.ai官网更新了多个优质公共数据集和教程。
  • 公共数据集包括DeepGlobe18、OpenForensics、DeepfakeTIMIT等。
  • 社区文章精选涉及人脸识别、苹果新品发布、蛋白质同源物检测等主题。
  • HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富的公共资源。
➡️

继续阅读