BriefGPT - AI 论文速递 ·

基于权重感知蒸馏的半监督学习及类别分布不匹配

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

通过数学推理揭示了半监督学习中类分布不匹配导致的错误，提出了一种稳健的半监督学习框架WAD，通过权重选择性地将对目标任务有益的知识转移到目标分类器，通过探索点互信息捕捉自适应权重和高质量伪标签，最大限度地发挥无标签数据的作用并过滤未知类别。实验证明WAD在类分布不匹配下具有群体风险的紧密上界。在基准数据集和人工交叉数据集上优于其他半监督学习方法和标准基准线。

🎯

关键要点

通过数学推理揭示半监督学习中类分布不匹配导致的错误。
伪标签错误和入侵错误共同限制了半监督学习的群体风险。
提出稳健的半监督学习框架Weight-Aware Distillation（WAD）。
WAD通过权重选择性地将对目标任务有益的知识转移到目标分类器。
探索点互信息（PMI）以捕捉自适应权重和高质量伪标签。
最大限度地发挥无标签数据的作用并过滤未知类别。
理论上证明WAD在类分布不匹配下具有群体风险的紧密上界。
实验证明WAD在CIFAR10、CIFAR100和人工交叉数据集上优于其他半监督学习方法和标准基准线。

🏷️

继续阅读

未来已来，只是分布不均
AI智能体在科技行业迅速发展，能够处理复杂任务并改变工作流程。然而，许多知识工作者认为AI应用仍处于早期阶段，面临上下文、权限和技术变化等挑战。成功的公司...
星火杯参赛小记：XDWe——驱动教学相长的AI智能学习助手
在星火杯比赛中，我和同学利用零代码平台开发了AI问答服务，旨在解决课堂教学问题，提供知识库和大模型问答功能。尽管遇到环境依赖和模块导入问题，最终项目成功完...
半马跑进1小时，机器人跑得要比人还快了？
【TechWeb】3月30日消息，人类半程马拉松的顶尖成绩约57分钟，这一曾被视作人类运动极限的数字，如今正成为人形机器人的新目标。下个月，北京人形机器人...
上海AI实验室发布“AGI4S珠穆朗玛计划”，构建中国科学智能创新中枢
上海AI实验室推出“AGI4S珠穆朗玛计划”，旨在构建科学智能创新中心，支持全球科学家实现重大突破。该计划通过整合算力、数据和实验平台，促进科研资源协同，推动科学发现。
浏览器扩展合集：派友近期推荐的 6 款浏览器扩展
近期推荐了6款实用的浏览器扩展，包括SmartClip、B站广告杀手和IntentFlow等。SmartClip是一款智能剪藏插件，支持多种笔记应用并提供...
2026年体育赛事直播现状
Ampere分析预测，到2030年全球体育版权价值将达780亿美元，流媒体平台将成为重要渠道。预计到2025年，美国体育转播权支出将达到305亿美元，Yo...