小红花·文摘

条件扩散中的组合泛化的局部机制

Apple Machine Learning Research ·

π0.7发布，VLA押出了机器人的GPT-3时刻

量子位 ·

条件扩散中的组合泛化的局部机制

Apple Machine Learning Research ·

本研究探讨了神经网络中的组合泛化问题，提出了必要且充分的条件，要求计算图与真实组合结构匹配，并在训练中编码足够信息。这一发现为神经网络的组合泛化评估提供了理论基础，具有重要意义。

A Theoretical Analysis of Compositional Generalization in Neural Networks: Necessary and Sufficient Conditions

BriefGPT - AI 论文速递 ·

该研究提出了“互动不对称”原则，强调相同概念部分间的复杂互动，促进概念的分离与组合，为生成函数提供理论基础，并在合成图像数据集上展示了有效的对象分离能力。

互动不对称：可组合抽象学习的一般原则

BriefGPT - AI 论文速递 ·

本文介绍了一种组合问题图的形式主义，旨在解决机器学习中的推广问题。提出了组合泛化问题和组合递归学习器，强调在多模式环境中利用句法结构的注意力技术提升组合概括的重要性。研究表明，Transformer语言模型在学习离散算法方面的能力有限，且在样本规模上表现不佳。此外，探讨了基于模块化架构的深度神经网络在零样本情况下的组合推理能力，以及生物神经网络对灵活认知的贡献。

通过隐含组合进行算法归纳的任务无关架构

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLMs）在推理能力和组合泛化方面的局限性，发现其在逻辑推理和复杂任务中的表现不佳。通过构建新数据集和评估方法，提出了提升模型推理能力的策略，强调了改进的必要性。实验结果显示，现有LLMs在多语言和中文任务中的准确性不足，需进一步优化。

大型语言模型在组合性关系推理中的限制探索

BriefGPT - AI 论文速递 ·