BriefGPT - AI 论文速递 ·

应对零膨胀数据：采用双重机器学习方法实现最优结果

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

该文介绍了一种简单的方法，通过利用标签空间的度量信息来适应已训练好的模型以预测新类别或提高零样本预测性能，无需额外训练。该方法可预测任何未观察到的类别，并在实证研究中相对于其他方法获得了高达29.7%的相对改进。

🎯

关键要点

提出了一种利用标签空间度量信息的方法，适应已训练好的模型以预测新类别。
该方法无需额外训练，能够提高零样本预测性能。
进行了全面的理论分析，研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡。
方法可以预测任何未观察到的类别，并在不能预测所有未观察到的类别时选择最优训练类别。
实证研究表明，该方法Loki在ImageNet上相对SimCLR获得高达29.7%的相对改进。
Loki方法可扩展到数十万个类别，并在没有可用度量指标时使用类别嵌入的自主度量。
在预训练的零样本模型（如CLIP）上，Loki获得了10.5%的改进。

🏷️

标签

度量信息机器学习标签空间零样本预测性能预测新类别预训练模型

➡️

继续阅读

数据显示：世界杯直播观看量比2022年增长473%
Everyone TV 公布的 Barb 收视数据显示，通过宽带观看 2026 年 FIFA 世界杯的人数显著增加，凸显了英国持续向互联网电视转型。 Ba...
涛思数据TDengine升级为AI原生工业数据平台
（全球TMT 2026年07月22日讯）涛思数据宣布TDengine产品重大升级，从高性能时序数据库正式演进为 […]
澳鹏数据已连续八届深度参与世界人工智能大会
(全球TMT 2026年07月21日讯)2026年7月17日至20日，2026世界人工智能大会暨人工智能全球治 […]
瀚高股份携新一代智能数据基座平台HigoBase参展WAIC 2026
(全球TMT 2026年07月21日讯)7月17日至20日，第八届世界人工智能大会（WAIC 2026）在上海 […]
Architecting offline-first generative AI applications for edge deployments using AWS services
According to Siemens’ 2024 report The True Cost of Downtime, Fortune 500 comp...
Automate custom PII detection at scale with Amazon Macie and Step Functions
Organizations in regulated industries like financial services, insurance, hea...