该研究提出了新方法ToolACE-R,针对工具学习的不足,引入自适应自我优化策略,通过迭代训练提升工具调用性能,实现高效优化。
本研究提出了一种新方法,通过隐式奖励从英文模型获取偏好,并将其迭代训练转移到其他语言,从而有效提升多语言模型性能,减少对多语言偏好数据的需求。
该研究提出了一种零-shot方式的对象检测方法,利用点聚类、时间一致性、CNN 的平移等性质以及自我监督来改进无监督检测算法。该方法能够在稀疏、远距离区域进行检测,并在更多迭代自我训练的过程中不断改进。在 PandaSet 和 Argoverse 2 Sensor 数据集上展示了该方法的显著优于无监督基线的性能,证明了自我监督与对象先验相结合可以实现野外对象发现的潜力。
本文提出了一种基于半监督学习的伪标记方法,通过迭代训练模型,取得了与现有最先进方法相媲美甚至更好的结果,并且更能抵御未知分布样本。在CIFAR-10数据集上,仅使用了4,000个标记样本,达到了94.91%的准确率,在Imagenet-ILSVRC数据集上,仅使用了10%的标记样本,达到了68.87%的top-1准确率。
Deshadow-Anything是一种模型,可以通过扩散模型沿着图像的边缘和纹理进行扩散,帮助去除图像中的阴影并保留图像的细节。该模型还设计了多自注意引导和自适应输入扰动来加速扩散的迭代训练速度。实验证明,这些方法可以有效提高图像修复性能。
完成下面两步后,将自动完成登录并继续当前操作。