这篇文章介绍了一个新任务:数据集大小恢复,通过模型权重确定训练样本数量。研究人员提出了DSiRe方法,用于恢复微调模型的图像数量,并发现LoRA矩阵的范数和频谱与微调数据集大小密切相关。通过发布新基准LoRA-WiSE,包含25000个权重快照,研究人员证明了最佳分类器可以预测微调图像数量,平均绝对误差为0.36个图像。
完成下面两步后,将自动完成登录并继续当前操作。