浙大团队提出了一种自我监督的强化学习方法GUI-RCPO,能够在无标签数据上提升GUI定位能力。该方法通过区域一致性引导模型自我优化,减少对标注数据的依赖,展现出良好的泛化性和准确性。实验结果显示,GUI-RCPO在不同模型上均有显著提升,验证了其有效性。
Databricks推出Agent Bricks,简化企业特定代理的开发。该平台通过自然语言反馈自动生成评估套件,优化代理质量。用户选择任务后,系统自动创建评估基准并进行优化,确保高效且具成本效益。新方法ALHF和TAO提升了模型质量,支持无标签数据的优化,适用于信息提取和知识助手等应用,促进领域专家参与系统改进。
Ubiquant团队提出了一种新方法——熵最小化(EM),仅需一条无标签数据和10步训练,显著提升大语言模型(LLM)性能,超越传统强化学习(RL)方法。EM通过优化模型预测的熵,增强模型自信,适用于数据稀缺场景,降低后训练成本。研究表明,EM在数学推理任务中表现优异,具有广泛应用前景。
本研究提出了一种数据中心的创新范式,通过CoOpt框架优化无标签数据,显著提高深度学习的训练效率和模型性能,具有实际应用价值。
本研究提出了一种表格数据适配器(TDA)的方法,以改善无标签私有数据的异常检测。通过识别相似的公共数据集并转换私有数据格式,生成弱标签,从而提高了50个领域的数据集的注释准确性,并减少了计算时间。
从无标签数据中学习解耦表示是机器学习中的一大挑战,解决此问题有助于推广、可解释性和公平性。尽管理论上难以实现,但实践中常通过先验匹配来解决。最新研究表明,结合几何特征可以增强先验匹配。我们提出了一种基于二次最优传输的新方法,利用Gromov-Monge映射以最小失真传输分布,同时尽量保留几何特征。我们提出的Gromov-Monge-Gap正则化器有效评估映射的几何失真,并在四个基准测试中表现优于其他方法。
本研究探讨了自编码器与深度聚类结合的框架,旨在无标签数据中有效学习低维非线性表示。研究结果表明,该方法显著提升了聚类任务的表示学习质量,为未来的深度学习与聚类研究奠定了基础。
基础模型是训练于大量无标签数据的人工智能神经网络,能够执行多种任务,如文本翻译和医学图像分析。2023年发布了149个基础模型,应用范围广泛。基础模型通过无监督学习节省标注时间,适应性强,具备处理文本、图像和视频等多种数据类型的多模态能力。随着技术进步,基础模型在商业和工业中的应用不断增加,但也面临偏见和知识产权等挑战。
本研究提出了一种自监督预训练框架FSFM,通过掩码图像建模和实例区分方法,利用大量无标签的真实面孔学习人脸表征。实验结果显示,该模型在多个数据集上的迁移性能显著优于传统方法,增强了人脸安全任务的泛化能力。
本研究提出了一种无需调优的方法,解决物体插入和主体驱动生成中的高数据收集成本问题。通过利用无标签数据的共现现象,构建强大的配对数据集,训练高效的文本到图像扩散架构,提升物体身份保持和图像合成效果。
本研究解决了自监督学习方法在无标签数据上的质量监控问题,并提出了评价指标与线性探测准确性的比较。研究发现,随着训练进展,熵的表现会发生变化,可能具有独立性。
自我监督学习方法通过解决预设任务,利用无标签数据进行模型训练,降低成本。研究发现线性/kNN探测协议是最好的预测器,批归一化对领域转移有重要性。挑战区分性和生成性自我监督方法之间的关系,发现性能差异可通过模型解释。
SAL是一个新的学习框架,使用无标签数据来提高检测超出分布数据的安全性和可靠性。它通过分离候选离群值并使用这些值和标记的正态数据训练离群值分类器,证明了其能以较小的错误率分离候选离群值,并在基准测试中取得了最先进的性能。
本研究提出了一种自监督学习框架,通过训练适配器将不同视角的特征映射到统一空间,解决交叉视图地理定位挑战。实验证明该方法在减少参数和仅使用无标签数据的情况下,相较于标准模型和有监督方法,性能有显著改进,并具有广泛应用潜力。
我们提出了一种新颖的半监督方法,利用无标签数据和少量有标签数据,通过教师-参考-学生架构提高行动质量评估任务准确性,并引入置信度记忆提高伪标签可靠性。实验证明,我们的方法在三个行动质量评估基准数据集上显著改进,超过现有半监督行动质量评估方法。
该论文研究了工业应用中的异常模式检测技术,提出了一种在线异常检测和分割的框架。通过利用无标签数据来提高模型性能,使用神经气体网络对正常图像进行建模,并采用多尺度特征嵌入来获得鲁棒的表示。实验结果表明该方法在FOADS设置下取得了显著的性能。
本文提出了一种基于自监督技术的特征学习方法,适用于无标签的传感器数据。该方法可用于人类活动识别等领域,通过转化识别任务提供监督信号,提取有价值的特征。在智能手机环境下的无人监督、半监督和迁移学习情况下,性能与完全监督网络相当甚至更好。该技术可广泛应用于其他领域。
该论文研究了工业应用中的异常模式检测技术,提出了一种少样本在线异常检测和分割的框架。通过利用无标签数据来提高模型性能,使用神经气体网络对正常图像进行建模,并引入一种能够增量更新参数的算法。实验结果表明该方法在FOADS设置下取得了显著的性能。
完成下面两步后,将自动完成登录并继续当前操作。