小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
监督学习:预测建模的基础

监督学习是机器学习中用于预测建模的基础,通过标记数据训练模型,以便对新数据进行准确预测。该过程包括训练数据、学习算法和训练模型,主要分为回归和分类任务。成功的监督学习依赖于高质量的数据和模型的泛化能力。

监督学习:预测建模的基础

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-07T11:00:15Z

该研究提出三项标准以合成高质量的多模态数据,解决了标记数据不足的问题,并开发了表现优异的多模态多语言E5模型mmE5。

mmE5: Improving Multimodal Multilingual Embeddings through High-Quality Synthetic Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本研究提出了一种自回归预训练方法Moto,旨在解决机器人学习中缺乏标记数据的问题。通过将视频内容转化为潜在运动标记序列,提升机器人在动态环境中的操控性能。

Moto: A Latent Motion Token as the Bridging Language for Robot Manipulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种自监督学习方法,解决了结构健康监测中因标记数据稀缺导致的异常检测问题。该框架有效利用少量标记数据和大量未标记数据,显著提升了异常检测性能。

Anomaly Detection in Structural Health Monitoring Data with Scarce Labeled Data Using Self-Supervised Pretraining Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种基于半监督框架的线段检测方法,通过利用未标记图像和少量标记数据的连续性损失,实现了与完全监督方法相当的效果,为困难标注场景提供了新的应用可能性。

半监督学习对线段检测的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本研究提出了一种迁移学习框架,解决了支气管镜图像标记数据不足的问题,通过合成数据训练,显著提升了真实影像的深度估计准确性。

通过合成到真实领域的适应增强支气管镜深度估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z
监督学习类型 - 可能性的艺术

监督机器学习通过标记数据进行学习,主要分为分类(预测类别,如狗或猫)和回归(预测连续值,如薪水、年龄)两种类型。

监督学习类型 - 可能性的艺术

DEV Community
DEV Community · 2024-11-02T07:03:13Z

本研究提出了一种新方法(FL)²,旨在解决联邦学习中客户端缺乏标记数据的问题。通过引入正则化和自适应阈值,显著提升了无标记客户端的训练效果,缩小了与集中学习的性能差距。

(FL)²: Overcoming the Scarcity of Labels in Federated Semi-Supervised Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究提出了一种名为BoxAL的主动学习技术,用于解决自动捕捞登记中对标记数据的依赖。该技术通过评估目标检测模型的不确定性,在使用较少标记图像的情况下,达到了与随机采样相同的性能,并显著提高了训练效果。

通过BoxAL主动学习改进被丢弃鱼类物种的检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

我们提出了一个概率状态空间模型,用于解决测试时无法获取标记数据的适应问题。该模型通过推断时变的类别原型来实现动态分类,仅修改模型的最后一个线性层。实验结果显示,该方法在真实的分布变化和合成数据破坏方面具有竞争力,尤其在小测试批次的情况下表现出色。

通过在线熵匹配保护测试时适应:一种投注方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

本研究开发了一种框架,通过自动提取标记数据并训练CRNN模型,在嘈杂环境下实现了鸟类物种声音事件检测。模型在真实数据上达到了0.73的F1分数,为PAM技术在其他物种和栖息地的应用提供了可能。

TinyChirp: 低功耗无线声学传感器上使用 TinyML 模型的鸟鸣识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

我们提出了一个名为SSCBM的新框架,通过在标记和未标记数据上进行联合训练,并在概念层面对未标记数据进行对齐,解决了现有CBMs训练中的限制。实验证明我们的SSCBM既有效又高效,在仅有20%标记数据的情况下,实现了93.19%的概念准确性和75.51%的预测准确性。

半监督概念瓶颈模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

研究人员通过使用合成数据和少于1k个训练步骤,提出了一种新颖简单的方法来获取高质量的文本嵌入。他们利用专有的LLMs在近100种语言中生成大量多样化的合成数据,并使用标准对比损失在合成数据上微调开源的只解码LLMs。实验证明,该方法在高度竞争的文本嵌入基准上表现出强大的性能,而不需要任何标记数据。此外,当将合成数据和标记数据混合进行微调时,该模型在BEIR和MTEB基准上取得了最新的技术成果。

HU 参加 SemEval-2024 任务 8A:对比学习能否学习嵌入以检测机器生成的文本?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

自我训练是计算机视觉中一种使用额外数据的替代方法,具有更强的通用性和灵活性。研究表明,自我训练在低数据和高数据环境下使用更强的数据增强时都有帮助。在预训练有效的情况下,自我训练能够进一步提高对象检测的准确性。

启发式视觉预训练的自监督和有监督多任务学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-11T00:00:00Z

该文提出了一种简单直观的批量校准方法,能够控制批量输入的上下文偏差,解决了零-shot、只有推理过程中存在的问题。在少样本设置下,BC 进一步扩展,能够从标记数据中学习上下文偏差,并在多个任务中展示了优于以往校准基线的表现。

批量校准:重新思考上下文学习和提示工程的校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-29T00:00:00Z

该文介绍了无监督域自适应的方法,通过利用源领域标记数据和目标领域未标记数据来解决深度学习模型在面临目标域的分布变化时表现下降的问题。

T-UDA:序列点云中的时态无监督领域适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-15T00:00:00Z

深度学习在多个领域表现出色,但仅依靠标记数据训练模型不能保证在目标领域有好的表现。无监督域自适应通过利用源领域标记数据和目标领域未标记数据解决这个问题。已在自然图像处理、自然语言处理等领域取得令人期待的结果。该文对该领域的方法和应用进行了比较,并指出了当前方法的不足和未来研究方向。

检测、增强、组合和适应:目标检测中的四个无监督领域适应步骤

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码