机器之心 ·

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

这篇文章介绍了一种通过公理训练来教授Transformer模型因果推理的方法。研究团队通过构建数据集、损失函数和位置嵌入来实现公理训练。他们发现，训练在简单链上的模型可以泛化到更大的链上，但无法泛化到更复杂的场景。然而，如果在混合数据集上训练模型，则可以很好地泛化到各种评估场景。此外，他们还发现位置嵌入对于实现因果泛化非常重要。该方法还可以应用于解决更困难的问题，如根据因果关系分辨相关性。该研究提供了一种新的范式来教授模型学习因果推理。

🎯

关键要点

研究介绍了一种通过公理训练教授Transformer模型因果推理的方法。
训练在简单链上的模型可以泛化到更大的链上，但无法泛化到更复杂的场景。
在混合数据集上训练模型可以很好地泛化到各种评估场景。
位置嵌入对于实现因果泛化非常重要。
公理训练框架基于被动数据学习因果推理，能够用于学习任意公理。
研究团队构建了数据集、损失函数和位置嵌入以实现公理训练。
模型在简单链上训练后，能够在更大链上应用公理，但在顺序或结构泛化上表现不佳。
通过数据扰动提升模型的泛化能力。
公理训练方法能够解决更复杂的问题，如根据因果关系分辨相关性。
研究提供了一种新的范式来教授模型学习因果推理。

🏷️

继续阅读

何恺明首个语言模型：105M参数，不走GPT自回归老路
何恺明团队推出了新的扩散语言模型ELF，该模型采用连续的embedding空间进行文本生成，显著降低了生成困惑度。ELF在训练和采样效率上表现优异，仅用1...
使用合成控制进行产品实验：Python中全球LLM发布的因果推断
在产品实验中，全球发布模型升级可能导致测量陷阱，缺乏对照组。合成控制方法通过构建未处理单位的加权组合，帮助数据科学家在没有对照组的情况下进行因果推断。本文...
TeamCity 2026.1：命令行工具（CLI）、AI代理的模型上下文协议（MCP）支持、管道增强及更多功能
TeamCity 2026.1发布了新功能，包括命令行工具（CLI）、AI代理的模型上下文协议（MCP）支持和管道增强。此版本修复了高危安全漏洞（CVE-...
Thinking Machines 展示了近乎实时的AI语音和视频对话预览，并采用了新的交互模型
Thinking Machines公司正在开发一种新型AI交互模型，采用全双工架构，能够同时处理输入和输出，显著降低响应延迟。研究表明，该模型在交互质量和...
腾讯音乐收购喜马拉雅附条件获批；三星劳资谈判破裂罢工风险上升；英伟达CEO黄仁勋薪酬下滑27%
（全球TMT2026年5月13日讯）今日要点：腾讯音乐收购喜马拉雅附条件获批；快手评估拟议重组可灵AI之相关资 […]
谷歌发布安卓 AI 系统，这就是苹果想象中的自己
给 Gemini 不止一个身体#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

内容提要

关键要点

标签

继续阅读