该研究提出了MiMoTable基准,以缩小现有表格推理基准与实际应用之间的差距。MiMoTable包含真实电子表格,并通过六类元操作定义问题难度。实验结果表明,尽管已有模型表现良好,但在该基准上仍有提升空间,验证了新标准的有效性。
完成下面两步后,将自动完成登录并继续当前操作。