Achieving Performance Comparable to the Original Model with Just 12% of the Computation: YOPO Pruning Technique Proposed by Adobe and the University of Rochester

机器之心 ·

Achieving Performance Comparable to the Original Model with Just 12% of the Computation: YOPO Pruning Technique Proposed by Adobe and the University of Rochester

💡 原文日文，约3700字，阅读约需9分钟。

📝

内容提要

AIxiv专栏促进学术交流，Adobe与罗切斯特大学研究多模态大模型的计算冗余，提出YOPO剪枝方案。实验表明，LLaVA-1.5仅需12%的计算量即可保持性能，有效解决视觉token的计算开销问题。

🎯

关键要点

AIxiv专栏促进学术交流，机器之心已报道2000多篇内容。
论文核心作者包括罗切斯特大学的博士生和Adobe的研究员。
Adobe与罗切斯特大学研究多模态大模型的计算冗余，提出YOPO剪枝方案。
LLaVA-1.5仅需12%的计算量即可保持性能，有效解决视觉token的计算开销问题。
多模态大模型的计算成本随着输入token数量的平方增加，限制了其可扩展性。
提出的剪枝方法包括邻域感知视觉注意力、非活跃注意力头剪枝、选择性层丢弃和稀疏视觉投影。
实验结果显示，剪枝方法在多个基准测试中表现优异，性能损失仅为0.5%。
研究表明视觉计算冗余在多模态大模型中普遍存在，提出的方法具有良好的可扩展性。

❓

延伸问答

YOPO剪枝方案的主要贡献是什么？

YOPO剪枝方案通过减少计算冗余，使LLaVA-1.5仅需12%的计算量即可保持与原始模型相同的性能。

YOPO剪枝方案是如何解决计算冗余问题的？

该方案通过邻域感知视觉注意力、非活跃注意力头剪枝、选择性层丢弃和稀疏视觉投影等方法，优化了模型的计算模式。

YOPO剪枝方案在实验中表现如何？

实验结果显示，YOPO剪枝方法在多个基准测试中表现优异，性能损失仅为0.5%。

多模态大模型的计算成本为何会增加？

多模态大模型的计算成本随着输入token数量的平方增加，导致计算负担显著加重。

YOPO剪枝方案的可扩展性如何？

YOPO剪枝方案在处理视觉计算冗余方面具有良好的可扩展性，适用于不同规模的模型。

YOPO剪枝方案与其他剪枝方法相比有什么优势？

与其他方法相比，YOPO剪枝方案在不直接剪枝token的情况下，针对计算模式层面的冗余进行优化，性能下降更小。

🏷️

继续阅读

Broadcom Donates Velero to CNCF, Shifting Kubernetes Backup to Community Governance
Broadcom has announced the contribution of Velero, its Kubernetes-native back...
时间是一个构造，但它仍然可能破坏你的软件
本文讨论了JavaScript中日期和时间处理的复杂性，特别是Date对象的缺陷。Ryan与Bloomberg的高级软件工程师Jason Williams...
突破视觉仿真算力瓶颈！新一代具身智能仿真框架开源：高吞吐并行高保真渲染助力规模化训练
清华大学智能产业研究院与多家技术公司合作推出GS-Playground通用多模态仿真框架，旨在解决具身人工智能领域的核心难题。该平台实现高吞吐量并行物理仿...
太抓马了！马斯克OpenAI开庭，硅谷巨富互揭老底像极了村口吵架
马斯克与OpenAI的庭审备受关注，他指控OpenAI背离非营利初衷并索赔1500亿美元。在庭审中，马斯克承认捐款仅为3800万美元，并表示xAI使用Op...
用本地大模型驱动中文输入法，我做了一个实验性的项目 - 曦远Code
该项目探索将大语言模型（LLM）应用于输入法，通过上下文理解优化候选词排序。用户输入拼音后，LLM根据语境提供更相关的词汇，提升输入体验。项目使用Node...
保护每一次 AI 调用的隐私安全 — 面向企业和个人的大模型安全接入网关
智链 AI 网关为企业和个人提供安全接入大模型的服务，具备数据脱敏、隐私保护和全链路审计功能，确保敏感信息不泄露。支持多种主流 AI 提供商，具备高可用性...