Apple Machine Learning Research ·

揭示神经网络学习子空间的利用秩

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

本研究探讨了神经网络学习权重如何充分利用可用空间，通过数据驱动的转换保留层的功能映射并揭示低秩结构。发现转换可以减少参数并保持准确性，自监督预训练可以提高利用率，适用于下游任务。

🎯

❓

神经网络的学习权重通常是满秩的，表面上看似充分利用了空间，但实际上大多数模型只利用了可用空间的一部分。

研究提出了一种数据驱动的转换，将权重投影到数据与权重交互的子空间，从而揭示低秩结构并保留层的功能映射。

ViTB-16和ViTL-16在ImageNet上的平均层利用率分别为35%和20%。

转换后，ViTB-16和ViTL-16的参数分别减少到50%和25%，且微调后准确率下降不到0.2%。

自监督预训练可以将模型的利用率提高到70%，证明其适用于下游任务。

低秩结构的发现表明，神经网络的权重并未充分利用可用空间，可能存在优化的空间。

🏷️

23学习周刊-总第266期-2026年第23周
本周刊聚焦运维、Go语言和Vue技术生态，推荐多个优秀项目，包括基于SwiftUI的Mac终端应用muxy、轻量级剪贴板管理器Buffer和Rust开发的...
论独立游戏的起步立项方法论
在当下这个互联网时代做独立游戏，是幸运的，得益于各路大佬的经验分享，诸如引擎选择、外包渠道、素材获取，编程整合 […]
技嘉在COMPUTEX 2026展示多款生活美学主机
(全球TMT2026年6月5日讯)技嘉科技于COMPUTEX 2026展示多款生活美学主机，包含展现简约风格的 […]
技嘉于COMPUTEX 2026以“ENTER INFINITY”为主题开展
(全球TMT2026年6月5日讯)技嘉科技正式于COMPUTEX 2026以“ENTER INFINITY”为 […]
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
华为云在上海INSPIRE大会上发布了Agentic Infra新范式及多款Agentic AI产品，旨在推动企业智能化转型。大会还推出“行业AI梦工厂”...
史上最强游戏掌机来了！性能堪比 PS5，但……
今年掌机市场因元器件成本上涨而涨价，但英特尔等公司推出的新芯片提升了掌机性能和能效。微星和宏碁的新款掌机搭载英特尔 Arc G3 处理器，表现出色，续航能...