小红花·文摘

本研究提出了TailoredBench方法，旨在解决模型快速演变期间大型基准评估的资源消耗问题。该方法为每个目标模型定制评估，显著提高了准确率估计的有效性，实验结果表明在相同推断预算下，MAE准确率估计平均减少了31.4%。