小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
条件扩散中的组合泛化的局部机制

本文探讨了条件扩散模型的组合泛化能力,特别是长度泛化,即生成训练中未见过的对象图像。在CLEVR实验中,发现长度泛化在某些情况下可行,表明模型能够学习组合结构。研究表明,局部条件分数与组合泛化相关,成功的模型展现出局部条件分数,而失败的模型则没有。通过因果干预,可以在之前失败的模型中实现长度泛化。

条件扩散中的组合泛化的局部机制

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-28T00:00:00Z
π0.7发布,VLA押出了机器人的GPT-3时刻

量子位发布的模型π0.7在机器人领域展示了组合泛化能力,能够根据新任务组合已有技能,无需专项训练,表现优于经过微调的专家模型。研究表明,该模型通过多样化的提示和质量标签,有效利用各种数据,提升学习效果,标志着具身智能的新发展,推动机器人技术进步。

π0.7发布,VLA押出了机器人的GPT-3时刻

量子位
量子位 · 2026-04-17T06:57:35Z
条件扩散中的组合泛化的局部机制

本文探讨了条件扩散模型的组合泛化能力,特别是长度泛化,即生成比训练时更多物体的图像。研究发现,模型在某些情况下能够实现长度泛化,表明它们有时学习到组合结构。成功的CLEVR模型展示了局部条件分数,而失败的模型则没有。强制局部条件分数的干预可以恢复失败模型的长度泛化能力。

条件扩散中的组合泛化的局部机制

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-09T00:00:00Z

本研究探讨了神经网络中的组合泛化问题,提出了必要且充分的条件,要求计算图与真实组合结构匹配,并在训练中编码足够信息。这一发现为神经网络的组合泛化评估提供了理论基础,具有重要意义。

A Theoretical Analysis of Compositional Generalization in Neural Networks: Necessary and Sufficient Conditions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

该研究提出了“互动不对称”原则,强调相同概念部分间的复杂互动,促进概念的分离与组合,为生成函数提供理论基础,并在合成图像数据集上展示了有效的对象分离能力。

互动不对称:可组合抽象学习的一般原则

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本文介绍了一种组合问题图的形式主义,旨在解决机器学习中的推广问题。提出了组合泛化问题和组合递归学习器,强调在多模式环境中利用句法结构的注意力技术提升组合概括的重要性。研究表明,Transformer语言模型在学习离散算法方面的能力有限,且在样本规模上表现不佳。此外,探讨了基于模块化架构的深度神经网络在零样本情况下的组合推理能力,以及生物神经网络对灵活认知的贡献。

通过隐含组合进行算法归纳的任务无关架构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

本研究探讨了大型语言模型(LLMs)在推理能力和组合泛化方面的局限性,发现其在逻辑推理和复杂任务中的表现不佳。通过构建新数据集和评估方法,提出了提升模型推理能力的策略,强调了改进的必要性。实验结果显示,现有LLMs在多语言和中文任务中的准确性不足,需进一步优化。

大型语言模型在组合性关系推理中的限制探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码