BriefGPT - AI 论文速递 ·

主动广义类别发现

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文探讨了多种广义类别发现模型，包括基于半监督学习的联邦模型、动态概念对比学习框架和长尾分布的类别发现方法。这些方法通过提高聚类准确性和处理不平衡数据，在图像识别任务中表现出色，尤其在细粒度识别和未知类别处理方面。实验结果显示，这些新方法在多个数据集上取得了显著提升。

🎯

关键要点

提出了一种基于半监督学习的联邦广义类别发现模型，能够在不暴露客户机数据的情况下进行协同训练。
动态概念对比学习框架（DCCL）通过交替估计视觉概念和学习概念表示，提高了聚类准确性，尤其在细粒度识别上表现优异。
基于长尾分布的广义类别发现方法在ImageNet100上实现了约6-9%的性能提升，并在CIFAR100上表现出竞争力。
不平衡的广义类别发现（ImbaGCD）通过最优传输的期望最大化框架，显著改善了在不平衡数据集上的表现。
广义连续类别发现（GCCD）框架通过无监督学习方法发现新旧类别，提升了表示学习性能。
引入大型语言模型的主动学习框架Loop，改善了通用类别发现任务的模型性能，解决了未知类别的问题。
MetaGCD方法结合元学习和对比网络，实现了在已知类别中持续发现新类别的能力。
记忆一致性引导的分治学习框架（MCDL）通过利用未标记数据的区分性信息，显著提高了图像识别和语义转换任务的性能。

❓

延伸问答

什么是基于半监督学习的联邦广义类别发现模型？

该模型在不暴露客户机数据的情况下，通过协同训练生成全局GMM，从而提高类别知识的全面性。

动态概念对比学习框架（DCCL）有什么优势？

DCCL通过交替估计视觉概念和学习概念表示，显著提高了聚类准确性，特别是在细粒度识别上表现优异。

长尾分布的广义类别发现方法在性能上有何提升？

该方法在ImageNet100上实现了约6-9%的性能提升，并在CIFAR100上表现出竞争力。

不平衡的广义类别发现（ImbaGCD）是如何改善性能的？

ImbaGCD通过最优传输的期望最大化框架，显著改善了在不平衡数据集上的表现，CIFAR-100上提升约2-4%。

广义连续类别发现（GCCD）框架的主要功能是什么？

GCCD框架通过无监督学习方法发现新旧类别，提升了表示学习性能。

如何通过引入大型语言模型改善类别发现任务？

通过名为Loop的主动学习框架，提升模型性能并生成类别名称，从而解决未知类别的问题。

🏷️

标签

半监督学习图像识别类别发现聚类准确性长尾分布

➡️

继续阅读

XZ 后门这件事，最该记住的不是 0.5 秒
XZ Utils 后门再次提醒我们，供应链安全不只是一套扫描工具能解决的问题。真正容易被忽略的，是维护者压力、构建链路、发布包和线上异常之间那些不起眼的缝。
华为韬定律干翻NVL72？五千芯片组网性能炸裂，AI集群不再看单颗算力
五千块芯片干翻英伟达？华为的AI数据中心正在改写物理规则。华为用落后两代的制造工艺，硬是靠系统级设计把AI集群性能拉到了超算天花板。当英伟达还在铜线传输...
1年2664人实锤：多吃亚精胺，肝脏脂肪指数直降9个点，腰围缩3.7cm
吃火锅时往红油里猛涮三盘毛肚的老铁们注意了，你们每天吞下去的那点亚精胺，可能比你们家楼下药店卖的护肝片还狠，你敢信？这篇刚砸在《欧洲营养学杂志》上的研究...
Here are the 30,000 songs Sony is suing Udio’s AI music generator over
Sony Music Entertainment has filed another lawsuit against Udio, accusing the...
The FCC is planning to retroactively ban disguised DJI gadgets
Last October, we told you how the FCC had given itself the power to retroacti...
Google just bet its inference future on a chip built for one model
The race to make AI inference cheaper is pushing chip design beyond general-p...