本研究基于Neyman-Pearson引理重新设计了选择性分类的最优选择函数,提出的新方法显著提升了模型在协变量偏移场景下的性能。
本研究提出了一种新方法DeCIL,旨在解决模仿学习中的协变量偏移问题。通过去噪机制增强状态转移映射,显著提高了在噪声干扰下的成功率,无需额外的专家数据。
本研究提出DisCoPatch框架,旨在解决机器学习中因协变量偏移引发的OOD检测问题。该框架通过批量统计提升模型对数据边界的理解,表现优异,并在延迟和模型尺寸方面优于现有技术。
本研究提出了一种加权CART方法,旨在解决医疗应用中因协变量偏移导致的训练数据与目标数据分布不一致的问题。实验结果显示,该方法在医疗及其他领域具有显著的应用潜力。
本文介绍了一种名为REFUEL的策略优化方法,提升大型语言模型在多轮对话中的长期计划能力。REFUEL通过单一模型估计$Q$值,并在自生成数据上训练,解决协变量偏移问题。实验结果表明,REFUEL在长时间多轮对话中表现优于其他方法,具有很大应用潜力。
该文提出了一种新型组合目标函数,用于解决测试数据中的协变量偏移问题。实验证明该方法在公平性与准确性的权衡上优于其他基线方法,并在不对称协变量偏移的新颖设置下展示了显著优势。理论上证明了训练集上的加权熵项和预测损失可以近似于协变量偏移时的测试损失。
完成下面两步后,将自动完成登录并继续当前操作。