浙大团队提出了一种自我监督的强化学习方法GUI-RCPO,能够在无标签数据上提升GUI定位能力。该方法通过区域一致性引导模型自我优化,减少对标注数据的依赖,展现出良好的泛化性和准确性。实验结果显示,GUI-RCPO在不同模型上均有显著提升,验证了其有效性。
本研究提出了Baguan模型,通过战略预训练减少天气预测中的过拟合问题。该模型基于自我监督的Siamese自编码器,实验结果表明其在中期天气预测中优于传统方法。
该研究提出CLaP方法,旨在从大规模无注释时间序列数据中有效识别和定位潜在状态及其转变。CLaP通过自我监督技术,在无监督环境中显著提高了状态检测的精度和效率,实验结果表明其优于其他五种算法,并具备良好的可扩展性。
本文介绍了一种新的AI训练方法,称为选择性自我监督微调(S2SFT),该方法结合了自我监督和监督学习,能够在减少数据需求的同时提升20%的性能,并显著改善多个基准任务的表现。
本研究提出一种两阶段框架,整合知识图谱与大语言模型,通过自我监督量化表示方法压缩知识图谱信息。实验结果表明,该方法在链接预测和三元组分类任务中显著优于现有技术。
本文提出了优化学习的概念,设计了能够解决参数优化问题的代理。这些代理结合深度学习与自我监督训练,特别在电力系统的实时风险评估中展现出潜在价值。
本研究提出了一种新型主动学习框架MUSEL,旨在提升自我监督机器人学习的样本效率和准确性。实验结果表明,MUSEL在动作效果学习方面优于现有方法。
本研究探讨了机器学习在不同视角下识别同一物体的挑战,借鉴幼儿的注视行为。提出了一种生物启发的视觉学习模型,证明幼儿的视觉体验能增强物体表示学习,支持自我监督学习。
我们开发了MParrotTTS,一个支持多语言和多说话者的文字转语音模型。通过模块化的自我监督训练,该模型在最少数据下适应新语言,并保持说话者特征。实验显示,在六种语言中,MParrotTTS的语音流畅度和相似度优于现有模型,且仅需少量训练数据。
研究通过自我监督和对比学习在多器官数据集上预训练模型,提升乳腺肿瘤分割性能。结果表明,对比学习预训练优于监督基线,即使使用一半标记数据微调,仍表现良好。多器官数据预训练有助于提高下游任务性能。
研究提出了一种自我监督的互信息对齐方法(SAMI),用于优化多任务环境中的语言模型。SAMI通过增强行为偏好与模型响应的联系,在多任务测试中表现出色,尤其在数学准确性上有显著提升。该方法无需偏好标签或示范,能够在对话和摘要任务中超越预训练和微调模型,为模型优化提供了新思路。
我们提出了一种自我监督的机器学习框架OCT-SelfNet,用于眼部疾病检测。通过多个机构的数据集和两阶段训练方法,我们的方法在测试中获得了超过77%的AUC-ROC性能,相比基线模型提升了至少10%。
该文章介绍了一种解决多智能体强化学习通信问题的方法,通过自我监督的方式使用自动编码器预训练通信策略,实现从智能体观察中学习潜在马尔可夫状态。该方法适应新任务,支持智能体扩展,并能检测异常事件。实证结果显示该方法在未知任务中优于特定任务的通信策略。
本文提出了一种基于单目摄像头和单个LiDAR的方法,用于大规模场景下的3D多人姿态估计。通过设计一种有效的多模态融合策略,并充分利用时间信息来指导网络学习自然和连贯的人类运动,以点云的固有几何约束为自我监督,用图像上的2D特征点进行弱监督,无需依赖于任何3D姿态注释。实验结果表明了该方法的优越性和泛化能力。
本文介绍了一种在自动驾驶场景中进行无监督对象检测的方法,通过点聚类、时间一致性、CNN的平移等性质以及自我监督来改进算法,实现了零-shot方式的对象检测。该方法能够在稀疏、远距离区域进行检测,并在自我训练的过程中不断改进。实验证明该方法在PandaSet和Argoverse 2 Sensor数据集上的性能优于无监督基线,展示了自我监督与对象先验相结合的潜力。
大型语言模型(LLMs)是自我监督的预训练模型,可适应广泛的自然语言任务。一项新研究提出,LLMs表现出的智能实际上是面试官的智能,更多揭示了面试者的智能和信仰。该论文提出了七种启发于大脑系统的方法,以实现人工智能的普遍自主权。
该研究提出了一种增强图像分类对未知医院普适性的方法,通过自我监督和组织病理学场景中的常见分布偏移提取不依赖于训练标签的不变特征,并使用领域对齐模块进一步提取不变特征。实验证明该方法在不同级别图像粒度方面表现出优越性。
本文提出了一种改进方法,用于自我监督语音及音频分类中的SSAST模型。通过集成MAE的编码器-解码器结构,提高了预训练速度和内存使用率,并在下游任务中表现更优。同时,评估了预训练策略,并探讨了MAE风格预训练在视觉和音频领域的不同之处。
本文介绍了一种在自动驾驶场景中进行无监督对象检测的方法,通过点聚类、时间一致性、CNN 的平移等性质以及自我监督来改进算法。新的规划感知度量更好地衡量模型在自动驾驶场景中的性能。在数据集上展示了该方法优于无监督基线的性能,证明了自我监督与对象先验相结合的潜力。
完成下面两步后,将自动完成登录并继续当前操作。