利用GPT-4和苏格拉底方法提出了基于SocREval的评估框架,自动评估模型推理能力,消除人工参考链,提高GPT-4性能,超过现有评估指标。该框架在成本效益、提示编写和示例选择方面有效且健壮。
完成下面两步后,将自动完成登录并继续当前操作。