小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新方法TTRL,通过未标记数据对大规模语言模型进行强化学习训练,显著提升了模型性能,Qwen-2.5-Math-7B在AIME 2024上的通过率提高了约159%。

测试时强化学习(TTRL)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究提出了一种名为Ross3D的重构视觉指令调优方法,旨在解决大规模三维视觉-语言数据集的缺乏问题。该方法通过三维视觉监督,提升了三维场景理解的性能,并展示了未标记三维数据的潜力。

Ross3D: Reconstructive Visual Instruction Tuning with 3D Awareness

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z
TAO:利用测试时计算训练高效的大型语言模型,无需标记数据

我们提出了一种新方法,称为测试时自适应优化(TAO),该方法利用未标记数据和强化学习,在测试阶段提升大型语言模型的性能。TAO在文档问答和SQL生成等企业任务中优于传统微调,使开源模型Llama接近昂贵的专有模型质量。通过生成响应、评分和强化学习,TAO实现高效调优,降低推理成本。

TAO:利用测试时计算训练高效的大型语言模型,无需标记数据

Databricks
Databricks · 2025-03-25T17:00:00Z

本研究提出了一种新方法,解决药物-靶标相互作用预测中的数据稀缺问题。通过设计两个专家处理内外部数据,利用未标记数据增强协同作用,实验结果表明该模型在数据稀缺情况下显著优于现有方法,改进幅度最高达53.53%。

融合分离:数据稀缺条件下的协同专家混合用于药物-靶标相互作用预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究探讨了在标签稀缺情况下处理不一致未标记数据的方法,以提升半监督学习性能。提出了一种新方法,增强了鲁棒性,并建立了评估基准,旨在解决开放环境中的稳定性问题。

开放环境下的鲁棒半监督学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究提出了一种新方法LeaDQ,旨在解决联邦学习中未标记数据流的样本选择问题。通过多智能体强化学习优化客户端策略,显著提高了全球模型的准确性,实验结果表明其优于现有基准算法。

如何从未标记的数据流中查询联邦学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究提出了一种自监督学习方法,解决了结构健康监测中因标记数据稀缺导致的异常检测问题。该框架有效利用少量标记数据和大量未标记数据,显著提升了异常检测性能。

Anomaly Detection in Structural Health Monitoring Data with Scarce Labeled Data Using Self-Supervised Pretraining Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种新颖的图基聚类方法GraphCL,旨在解决半监督医学图像分割中未标记数据利用不足的问题。实验结果表明,GraphCL在标准测试中优于现有方法,展现出显著的应用潜力。

Graph-Based Semi-Supervised Medical Image Segmentation Clustering

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本研究提出了OwMatch框架,解决开放世界半监督学习中的未标记数据问题,确保自标注的无偏性。实验结果表明,该方法在已知和未知类别上显著提升了分类性能。

OwMatch: Consistent Conditional Self-Labeling for Open World Semi-Supervised Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z
自监督学习:少样本学习的游戏规则改变者

自监督学习是一种新兴的机器学习技术,通过利用未标记数据来提升模型性能并减少过拟合。结合少样本学习,研究人员能够更高效地训练模型。Lightly.ai等平台提供工具,帮助消除数据冗余和偏差,推动机器学习的发展。

自监督学习:少样本学习的游戏规则改变者

DEV Community
DEV Community · 2024-10-29T11:56:01Z

本研究提出了一种创新的“ReMix”模型,结合有限标记的多摄像头数据与大量未标记的单摄像头数据进行训练,显著提升了人物重识别(Re-ID)模型的泛化能力,优于现有方法,具有重要应用潜力。

ReMix:在混合数据上训练通用人物重识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本研究通过流形假设的标签传播方法,解决了机器学习中标记数据集的高成本问题。结果显示,该方法在情感分析中能显著减少所需标签数量,利用图形方法生成伪标签,有效整合未标记数据,降低成本。

Reducing Labeling Costs in Sentiment Analysis through Semi-Supervised Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本文探讨了主动学习和半监督学习在深度学习中的应用,提出了多种提高模型性能和训练效率的方法,包括基于后验熵的主动集合选择、样本自适应增强(SAA)和无监督选择性标注。这些方法在处理未标记数据和噪声标签时表现出色,显著提升了模型的准确性和鲁棒性。

通过代表性和多样化样本选择增强半监督学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本文探讨了测试时间适应(TTA)在机器学习中的应用与优化,提出了如ROID和AR-TTA等方法,以提高模型在动态环境中的鲁棒性和性能。研究表明,TTA的有效性依赖于模型质量,并需在更广泛的场景中进行评估。通过引入新技术,本文提升了医学图像分割等任务的表现,强调了适应未标记数据的重要性。

UniTTA:统一基准和多功能框架面向现实测试时适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

本文探讨了利用未标记数据提高癌症患者生存时间预测准确性的方法,提出了半监督学习、贝叶斯框架和跨模态融合等多种模型和框架。这些方法在生存分析中显著提升了预测性能,尤其是在处理多模态数据时。

多模态数据绑定用于含有不完整数据和注释的生存分析模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本研究提出了一种新的视觉领域适应CNN架构,利用未标记和稀疏标记数据实现域不变性优化,并通过软标签分布匹配损失提升性能。同时,研究探讨了多模态模型融合、动态转移方法及知识融合策略,显示出在无标注数据情况下的有效性和高效性。

多目标领域自适应的无需训练模型合并

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本文提出了一种基于平均教师框架的跨域检测Transformer,利用未标记数据进行目标检测训练,通过伪标签传输知识。该方法在多层次特征对齐和优化迭代下,在不同领域适应场景中表现优异,尤其在Sim10k到Cityscapes的转移中显著提升性能。

基于多粒度置信度对齐的跨域目标检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-10T00:00:00Z

通过SEABO方法,可以从专家数据和未标记数据中获取奖励函数。SEABO在只有一个专家轨迹的情况下,能够与真实奖励的离线强化学习算法相竞争,并在许多任务中优于先前的奖励学习和离线模仿学习方法。

SEABO: 离线模仿学习的简单基于搜索的方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-06T00:00:00Z
单目深度估计任意未标记数据:释放大规模数据潜力 | 开源日报 No.166

Depth-Anything 是一个开源项目,旨在对未标记数据进行单目深度估计,释放大规模数据的潜力。该项目提供了相对深度估计和优越的场景理解性能。

单目深度估计任意未标记数据:释放大规模数据潜力 | 开源日报 No.166

开源服务指南
开源服务指南 · 2024-01-26T23:35:07Z

该文章介绍了一种记忆一致性引导的分治学习框架(MCDL),通过引入两个内存库记录未标记数据的历史预测,利用预测一致性衡量每个样本的可信度,并设计了分治学习策略来充分利用未标记数据的区分性信息,减小噪声标签的负面影响。实验证明该方法在通用图像识别和语义转换任务中具有广泛性和优越性。

内存一致性引导的分治学习方法用于广义类别发现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码