训练加速的多样化批次选择
📝
内容提要
现代机器学习模型对大型数据集的卓越成功往往需要大量的训练时间和资源消耗,为了节省成本,一种被广泛研究的方法是在线批次选择,在训练过程中选择信息量较大的子集。然而,现有的方法依赖于额外的参考模型,限制了它们的实际应用,因为这样理想的模型并不总是可用。为了解决这一困境,我们提出了一种无需参考模型的多样化批次选择算法(DivBS),可以有效地选择多样化和代表性的样本。我们定义了一种新的选择目标,以...
➡️