量子位 ·

无预训练模型拿下ARC-AGI榜三！Mamba作者用压缩原理挑战Scaling Law

💡 原文中文，约3800字，阅读约需9分钟。

📝

内容提要

CompressARC研究表明，未经过预训练的76K参数模型在ARC-AGI-1基准上解决了20%的问题，挑战了智能依赖大规模预训练的假设。该方法仅利用谜题本身，实现了对ARC-AGI谜题的泛化求解。

🎯

关键要点

CompressARC研究表明，未经过预训练的76K参数模型在ARC-AGI-1基准上解决了20%的问题。
该方法仅利用谜题本身，实现了对ARC-AGI谜题的泛化求解。
CompressARC采用最小描述长度（MDL）理论，寻找用最短程序表达谜题的方法。
研究未使用ARC-AGI的训练集，且仅在单个样本上运行。
CompressARC获得ARC Prize 2025的第三名，使用了一张GPU完成研究。
模型通过最小化目标谜题的描述长度来解决问题，而非学习泛化规则。
CompressARC的架构设计包括等变性处理、多张量数据结构和无参数的自定义操作。
实验显示，CompressARC在推理时解决了20%的评估集谜题和34.75%的训练集谜题。
研究挑战了智能必须依赖大规模预训练的假设，展示了MDL和压缩原理的潜力。
ARC-AGI-1基准测试旨在评估AI处理新颖问题的能力，是衡量通用人工智能的核心标尺。

❓

延伸问答

CompressARC模型是如何在ARC-AGI-1基准上取得成功的？

CompressARC通过最小化目标谜题的描述长度，利用76K参数的未预训练模型解决了20%的问题。

最小描述长度（MDL）理论在CompressARC中的应用是什么？

MDL理论用于寻找用最短程序表达谜题的方法，从而揭示其最深层的规律。

CompressARC与传统神经网络的学习方式有何不同？

CompressARC不学习泛化规则，而是直接寻找特定谜题的最短程序表达。

CompressARC在ARC-AGI-1基准测试中的表现如何？

CompressARC在评估集上解决了20%的谜题，在训练集上解决了34.75%的谜题。

CompressARC获得了什么奖项？

CompressARC获得了ARC Prize 2025的第三名。

CompressARC的架构设计有哪些关键特点？

CompressARC的架构包括等变性处理、多张量数据结构和无参数的自定义操作。

🏷️

继续阅读

Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
全球首个机器人训练楼盘开盘：30万套中国住宅，机器人拎包入住
大晓机器人与港中文MMLab推出Kairos-Homeworld，这是首个全屋三维生成与物体级交互框架，利用30万套中国住宅户型数据为机器人提供训练环境。...
阶跃Step 3.7 Flash登顶AA榜：速度、性价比、端到端三项第一
阶跃星辰推出的Step 3.7 Flash模型在速度和成本上表现优异，推理速度超过400 tokens/s，单任务成本仅为Claude Opus 4.6的...
MiniCPM5-1B采用RL+OPD训练，多项复杂任务达SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench
TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨...
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...