小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
使用合成控制进行产品实验:Python中全球LLM发布的因果推断

在产品实验中,全球发布模型升级可能导致测量陷阱,缺乏对照组。合成控制方法通过构建未处理单位的加权组合,帮助数据科学家在没有对照组的情况下进行因果推断。本文介绍了如何使用Python实现合成控制,验证其有效性,并讨论常见的失败模式及应对策略。

使用合成控制进行产品实验:Python中全球LLM发布的因果推断

freeCodeCamp.org
freeCodeCamp.org · 2026-05-12T04:55:04Z
基于倾向评分的产品实验:Python中LLM特征的因果推断

文章讨论了在基于大型语言模型(LLM)的产品中,用户选择新功能(如AI助手)时的偏差问题。重度用户更倾向于尝试新功能,导致比较结果失真。为解决这一问题,文章介绍了倾向评分方法,通过统计工具消除选择偏差,准确评估功能效果,并提供具体步骤和代码示例,帮助数据科学家在产品实验中应用这些方法。

基于倾向评分的产品实验:Python中LLM特征的因果推断

freeCodeCamp.org
freeCodeCamp.org · 2026-04-30T23:01:26Z
在模型错误指定的模拟推断中的归纳领域转移

本文介绍了一种新的模拟推断(SBI)框架,旨在解决模型错误指定问题。该框架结合半监督校准和最优传输,通过端到端训练实现真实与模拟观察的对齐。与现有方法相比,该方法在多个基准测试中表现更佳,尤其在复杂医疗生物标志物估计中具有更好的可扩展性和适用性。

在模型错误指定的模拟推断中的归纳领域转移

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-27T00:00:00Z
通过数据驱动校准解决基于模拟的推断中的模型错误指定

随着深度生成建模的发展,基于模拟的推断(SBI)成为推断随机模拟器参数的主要方法。然而,模型错误指定会影响SBI的可靠性。本文提出鲁棒后验估计(RoPE)框架,通过小规模真实校准集克服模型错误指定,利用最优传输(OT)形式化错误指定差距,学习模型而不增加额外假设。实验表明,RoPE在严重错误指定的情况下仍能提供可靠的推断和校准的不确定性。

通过数据驱动校准解决基于模拟的推断中的模型错误指定

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-11T00:00:00Z

本文介绍了一种名为ConDiSim的条件扩散模型,旨在解决复杂系统的基于仿真的推断问题,尤其是处理不可处理似然性的情况。该模型通过学习去噪过程,有效捕捉后验分布中的复杂依赖关系和多模态性。研究表明,ConDiSim在多个基准问题和真实世界测试中表现优异,适用于快速推断的参数推断工作流。

ConDiSim:用于基于仿真的推断的条件扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z
HarmonyOS Next开发要点:仓颉语言的高效类型系统与类型推断

仓颉语言的类型系统和类型推断机制显著提高了HarmonyOS Next应用的开发效率和可靠性。作为静态类型语言,仓颉在编译时确定变量类型,避免运行时错误,并支持智能类型推断,使代码更简洁和安全。尤其在大型项目中,仓颉的类型系统确保了高质量和快速开发。

HarmonyOS Next开发要点:仓颉语言的高效类型系统与类型推断

DEV Community
DEV Community · 2025-05-08T09:09:05Z
Lambda推断的局限性

文章讨论了链式lambda表达式的类型推断问题,指出方法引用更易于推断,并提供了显式类型、拆分链式和强制泛型类型等解决方案。强调在Comparator等流式接口中使用方法引用的优势。

Lambda推断的局限性

DEV Community
DEV Community · 2025-04-29T21:59:51Z

本研究针对现有聚合统计方法中存在的隐私风险进行了探讨,提出了一种名为DeSIA的属性推断攻击框架。研究结果表明,DeSIA在识别易受攻击用户方面表现优异,真阳性率达到0.14,在错误阳性率为$10^{-3}$的情况下显著优于重建攻击。此发现强调了聚合统计数据不足以保护隐私,推动了在发布统计数据前进行正式隐私机制和测试的必要性。

DeSIA:针对有限固定聚合统计数据的属性推断攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-25T00:00:00Z
人工智能因果分析师:大型语言模型代理自动化因果发现与推断

Causal-Copilot是一个基于大型语言模型的自动化因果分析系统,旨在简化因果分析流程,使非专业人士能够进行复杂分析。该系统集成多种因果发现和推断算法,支持大规模数据集处理,提高分析的可访问性和准确性。

人工智能因果分析师:大型语言模型代理自动化因果发现与推断

DEV Community
DEV Community · 2025-04-24T21:53:10Z

本研究针对长上下文语言模型在推理过程中高GPU内存需求的问题,提出了一种新方法——内存高效的卸载迷你序列推断(MOM)。该方法通过将关键层分割成较小的“迷你序列”,并与KV缓存卸载集成,能够减少50%以上的峰值内存使用并显著延长单个GPU的最大上下文长度。这一创新不仅保持输出一致性和准确性,还优化了资源利用,为后续研究指明了新的方向。

内存高效的卸载迷你序列推断用于长上下文语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

研究团队提出Celcomen模型,利用因果解耦方法分析空间转录组学数据,揭示细胞内外的基因调控机制。该模型在真实数据中表现优异,推动生物医学研究进展。

入选ICLR 2025!剑桥大学提出Celcomen模型,首次在空间转录组学分析中实现因果推断可识别性

HyperAI超神经
HyperAI超神经 · 2025-03-17T09:24:38Z

剑桥大学研究团队提出了Celcomen虚拟组织模型,实现了空间转录组学中的因果推断可识别性。该模型能够估计环境对单细胞的影响,并推测细胞对环境的作用,推动对细胞间复杂相互作用的理解。Celcomen结合拉格朗日力学和因果推断,展现出强大的自洽性和可识别性,具有重要的生物医学应用潜力。

入选ICLR 2025!剑桥大学提出Celcomen模型,首次在空间转录组学分析中实现因果推断可识别性

HyperAI超神经
HyperAI超神经 · 2025-03-17T03:26:29Z

本研究提出了一种基于梯度的成员推断测试(gMINT),用于判断特定文本是否被用于训练大型语言模型。实验结果显示,gMINT在七个基于Transformer的模型上表现出高鲁棒性,AUC得分在85%到99%之间,为数据隐私保护提供了可靠的审计工具。

我的文本在你的人工智能模型中吗?基于梯度的成员推断测试应用于大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
TypeScript 5.8 发布,改进了类型推断和更好的 JavaScript 生态系统互操作性

微软的丹尼尔·罗森瓦瑟宣布发布TypeScript 5.8,改进了类型推断和性能,支持JavaScript生态系统。新版本能检测条件返回类型的错误,并允许开发者在Node.js中直接运行TypeScript,无需编译。

TypeScript 5.8 发布,改进了类型推断和更好的 JavaScript 生态系统互操作性

InfoQ
InfoQ · 2025-03-08T02:00:00Z
推断的常量泛型参数:征集测试!

特性(generic_arg_infer)即将稳定,允许Rust显式推断常量参数。之前的限制已解决,相关示例现可编译。希望用户在最新版本中测试并反馈问题。

推断的常量泛型参数:征集测试!

Inside Rust Blog
Inside Rust Blog · 2025-03-05T00:00:00Z

本研究解决了在部分已知密度下进行高效采样的问题,提出了一种新的粒子变分推断方法R-ParVI。该方法采用奖励机制引导粒子运动,通过模拟粒子与环境的交互,实现了快速、灵活且可扩展的采样和推断,特别适用于贝叶斯推断和生成建模中的概率模型。

R-ParVI:基于粒子的变分推断方法通过奖励的视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z
关于DeepSeek我是怎么研究的(3)

本文介绍了DeepSeek的推理机制,包括推理结构、策略和操作。通过24点游戏示例,展示了DeepSeek的思考过程,强调推理与推断的区别。推理注重逻辑性和解释性,适用于复杂问题,而推断依赖数据和统计模型,结果通常是概率性的。推理机制提升了模型的灵活性、可扩展性和可解释性。

关于DeepSeek我是怎么研究的(3)

Shadow Walker 松烟阁
Shadow Walker 松烟阁 · 2025-02-23T14:30:21Z

本文探讨了机器如何利用具象符号进行推理,提出了一种结合概率推理与谓词符号推理的新方法。研究表明,通过线性大小数据的联合分布,可以有效推广谓词逻辑的结果,并重新审视相关问题。

基于归纳推理的具定语逻辑的抽象推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z

本研究探讨视觉语言模型(VLMs)在处理视觉和语言线索下的无知推断能力,发现模型对语言线索敏感,但在视觉线索的推断能力上表现较弱且不一致,指出VLM在语用推理方面存在困难,需进一步改进。

视觉语言模型中视觉和语言线索对无知推断的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本文研究序列变点分析中的一个重要挑战:在检测到变化后进行推断。通过构建未知变点的置信区间,提供了理论合理且实用的序列变点定位工具。

Post-detection Inference for Sequential Changepoint Localization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码