小红花·文摘

SAVA：通过词汇适应提高意大利语大型语言模型的速度和成本效益

DEV Community ·

本文介绍了一种新的数据估值框架OpenDataVal，利用Wasserstein距离和敏感性分析方法，能够有效识别低质量数据并提升性能。该框架支持多种数据估价算法的比较，并通过实验验证了其有效性。此外，介绍了高效聚类框架SkeVa family和新数据评估方法Data-OOB，均在大规模数据集上表现优异。

SAVA: 可伸缩的学习无偏数据估值

BriefGPT - AI 论文速递 ·