该研究提出了MiMoTable基准,旨在缩小表格推理与实际应用之间的差距。基准包含真实电子表格,并通过六类元操作评估问题难度。实验结果表明,现有模型在MiMoTable上仍有改进空间,验证了新标准的有效性。
完成下面两步后,将自动完成登录并继续当前操作。