小令童鞋 ·

半监督学习

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

监督学习是训练样本包含标记信息的学习任务，无监督学习是训练样本不包含标记信息的学习任务。主动学习通过使用有标记样本数据集训练学习器，再基于该学习器对未标记样本进行预测，从中挑选出不确定性高或分类置信度低的样本来咨询专家并进行打标，最后使用扩充后的训练集重新训练学习器，以降低标记成本。半监督学习利用未标记样本所包含的分布信息，训练集同时包含有标记样本数据和未标记样本数据。生成式方法是基于生成式模型的方法，通过对联合分布建模进一步求解后验概率。半监督SVM试图为未标记样本找到合适的标记指派，使得超平面划分后的间隔最大化。基于分歧的方法通过多个学习器之间的分歧来利用未标记样本数据，协同训练是其中的一种方法。半监督聚类是借助已有的监督信息来辅助聚类的过程。

🎯

关键要点

监督学习是训练样本包含标记信息的学习任务，无监督学习是训练样本不包含标记信息的学习任务。
主动学习通过使用有标记样本数据集训练学习器，再对未标记样本进行预测，挑选不确定性高的样本咨询专家打标，降低标记成本。
半监督学习利用未标记样本的分布信息，训练集同时包含有标记和未标记样本数据。
生成式方法基于生成式模型，通过对联合分布建模求解后验概率，依赖于对潜在数据分布的假设。
半监督SVM试图为未标记样本找到合适的标记指派，使得超平面划分后的间隔最大化。
基于分歧的方法通过多个学习器之间的分歧利用未标记样本数据，协同训练是其中一种方法。
半监督聚类借助已有的监督信息辅助聚类过程，主要包括必连与勿连约束和标记信息两种类型。

🏷️

继续阅读

本田的混合动力未来始于全新雅阁和RDX原型车
本田在年度业务简报中发布了全新混合动力车型原型，包括雅阁轿车和RDX SUV，计划到2030年推出15款新混动车型。公司将重心转向混合动力，预计新一代混合...
batata-基于rust兼容nacos和consul的服务配置管理平台
Batata 是一个基于 Rust 的高性能动态服务发现和配置管理平台，兼容 Nacos 和 Consul API。其核心特性包括集中式配置管理、服务发现...
关于DS4的几点看法
DwarfStar 4迅速走红，满足了本地AI集成需求，支持在96或128GB内存下运行。作者希望未来版本能涵盖编码、法律和医疗等专业领域。DeepSee...
结束时刻
在马斯克与奥特曼的法庭争斗中，马斯克的律师表现不佳，缺乏有力证据，而奥特曼的律师则展示了大量证据，揭示马斯克在AI领域的失败。马斯克承认其xAI项目依赖于...
GitHub可用性报告：2026年4月
GitHub Copilot将于6月1日更新个人计划，推出Pro和Pro+的灵活配额及新Max计划。同时，开发者需关注青少年安全法规对操作系统和应用商店的...
学习周刊-总第263期-2026年第20周
本文介绍了一系列开源项目，包括Chorus（协作平台）、Pixley Reader（Markdown阅读器）、Novelvids（小说转短剧平台）和Ref...

半监督学习

内容提要

关键要点

标签

继续阅读