FineMath是一个用于评估中文LLMs数学推理能力的数据集,包含小学数学教学的主要概念,划分为17类数学应用问题。实验结果显示中文LLMs的数学推理能力有待提升。作者还分析了之前被忽视的评估过程和方法对结果的影响。数据集将于2024年3月发布。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: