小红花·文摘

研究发现，在大规模数据集上，参数稀疏性对Transformer模型的影响。随着训练数据量增加，最佳稀疏度增加，为提高计算效率提供理论理解和实际意义。

基于变形器的学习可证明具有低秩和稀疏性：一层分析

BriefGPT - AI 论文速递 ·

神经符号 AI 结合深度学习与符号 AI，减少训练数据量，提高模型解释性和可解性，验证系统正确性。研究神经符号学习，使用符号语言和背景知识，通过推理和训练神经网络交流知识。

走向完全声明性神经符号语言

BriefGPT - AI 论文速递 ·

最近的研究发现，神经网络在几何领域中缺乏人类的识别和操作能力，但通过扩展模型规模和训练数据量，神经网络开始展现出更类似人类推理的能力。研究还发现，神经网络在抽象几何处理方面表现出与人类相似的能力。

神经网络中的维度抽象的关系归纳偏好

BriefGPT - AI 论文速递 ·

最近的研究发现，神经网络在几何领域中缺乏人类的抽象几何处理能力。通过扩展模型规模和训练数据量，神经网络开始表现出更类似人类推理的能力。研究还发现几何视觉处理中存在三个关键偏见：对复杂性、规律性和部分与关系的感知敏感性。大型预训练神经网络模型在这些任务中表现出更类似人类的抽象几何处理能力。

大规模预训练神经网络中的人类化几何抽象

BriefGPT - AI 论文速递 ·

本文研究了参数稀疏性对Transformer模型在大规模数据集上训练的影响，并确定了描述权重稀疏性、非零参数数量和训练数据量之间关系的扩展定律。研究发现，在非零参数数量固定时，最佳稀疏度随着用于训练的数据量增加而增加。同时，研究还将扩展到了不同的稀疏结构和策略，揭示了权重稀疏性的能力和局限性，为提高计算效率提供了理论理解和实际意义。

关于联想记忆的缩放定律

BriefGPT - AI 论文速递 ·