领先的人工智能公司正在开发一种安全的非自主AI系统——Scientist AI,旨在通过观察和概率推理支持科学研究,降低自主AI的风险,促进科学进步并确保安全。
本文探讨了机器如何利用具象符号进行推理,提出了一种结合概率推理与谓词符号推理的新方法。研究表明,通过线性大小数据的联合分布,可以有效推广谓词逻辑的结果,并重新审视相关问题。
该研究提出了一种新颖的粒子蒙特卡洛方法,能够在推理时将大型语言模型的计算成本降低40%。该方法通过自适应计算的概率推理框架优化计算资源,同时保持模型质量,展现出比标准方法更高的效率。
本研究探讨如何从大型语言模型中提取常识,以支持缺乏特定数据的概率推理。我们提出了一种通过提示生成相关变量集合并优化其联合分布的方法。实验结果表明,该框架在处理真实数据集的概率问题时表现优异,且对噪声具有良好鲁棒性。
本文介绍了多种知识图谱嵌入模型及其进展,如UKGE、PRASE和kNN-KGE,旨在提升对不确定性和复杂逻辑查询的建模能力。这些方法结合概率推理和语义嵌入,显著提高了知识图谱在实体对齐和知识图谱完成任务中的性能。
本研究通过将整数随机变量的线性算术转化为张量操作,并结合快速傅里叶变换,解决了神经符号技术中的概率推理复杂性和梯度构建困难问题,提升了推理和学习效率。
本文提出了一种基于随机神经网络的概率推理算法,利用Stein变分法优化神经网络参数,适用于多种目标分布。通过训练深度能量模型和神经采样器,实现高质量图像生成。同时,研究了强化学习中的样本效率与适应性,提出改进模型RGDM,显著提升样本生成控制能力。
本文介绍了ThinkSum,一个两阶段概率推理模型,旨在提升大型语言模型(LLMs)的推理能力。研究发现,LLMs在逻辑和常识推理方面存在局限,尤其在条件句和概率推理任务中表现不佳。通过新方法和数据集,研究者探讨了LLMs的推理机制及其与人类智力的差异,推动了对人工智能潜力与限制的讨论。
本文介绍了一种新型的约束强化学习方法CPPO,将其视为概率推理问题,通过一阶更新优化策略,解决了传统方法的复杂性和低效性。同时,研究提出了多任务强化学习和基于原始-对偶算法的策略,旨在统一现有技术并提供多种策略约束的工具箱。
本文介绍了折叠状态变分推断(CSVI)算法及其在空间环境中的应用,研究表明CSVI与正向置信传播法表现优异。同时,探讨了强化学习中的状态-行为优化及其与变分贝叶斯方法的结合,提出了VAPOR策略,展示了其在深度强化学习中的优势。
本文综述了图模型的提升及其在概率推理中的应用,介绍了抬升推断算法和相关统计关系表达式。文章强调了在处理结构化与非结构化数据时,统计关系模型的需求将增加,并为新研究者提供了入门指导。
本研究探讨了形式语言在数量化概率推理和因果效应中的应用,分析了可满足性问题的计算复杂性。研究涉及三层因果关系,涵盖概率逻辑、do-calculus推理和反事实查询,证明了相关语言的可满足性和有效性可在多项式空间内判定。同时,提出了新的反事实推断方法和概率时序逻辑,探讨了马尔可夫链的复杂性问题。
本文讨论了神经向量符号架构(NVSA)在Raven's渐进矩阵和I-RAVEN数据集上的应用,准确率分别为87.7%和88.1%。NVSA在概率推理上表现出显著的速度优势。研究还探讨了基于VSA的认知模型及其在自然语言处理中的应用,强调高维计算框架的重要性和未来发展方向。
该论文提出了一个基于元学习近似概率推理的学习框架VERSA,使用摊销网络构造了一个不同于传统优化的前向传递框架。该方法在评估中表现出色,能够处理任意数量的FEL-SHOT和分类任务。
本研究介绍了一种名为VAPOR的深度强化学习方法,通过马尔科夫决策过程的图形模型,以概率推理的方式对状态-行为对的访问概率进行研究。该方法采用贝叶斯方法处理状态-行为优化的后验概率,并通过变分贝叶斯近似方法得到一个可行的凸优化问题。实验结果显示,VAPOR在性能上具有优势。
该研究提出了一种新的期望最大化方法,从概率推理的角度解决了安全增强学习问题,实现了更稳定和更高效的学习表现。在连续机器人任务的实验中,取得了显著的约束满足性能和样本效率提升。
该研究探讨了ProbLog与概率推理相结合的一种形式,即概率抽象论证。研究表明ProbLog是概率抽象论证的一种实例,为ProbLog提供了替代语义和新的论证语义,同时为ProbLog的输出提供了新的形式的论证解释。
完成下面两步后,将自动完成登录并继续当前操作。