本研究评估了大语言模型在常识理解和抽象推理中的不足,并提出了两种提示方法。实验结果显示,使用示例指导选择关系时准确性有所提高,但在限制预测单一关系时表现下降。这表明,尽管模型在常识推理方面仍存在差距,设计良好的提示方法能够提升其性能。
Meta最近开源了大型概念模型(LCM),该模型在更高抽象层次上操作,使用独立于语言和模态的句子嵌入空间。LCM在多语言摘要任务中优于同规模的Llama 3.1模型,支持200种语言的文本和76种语言的语音数据,旨在更好地模拟人类的抽象推理能力,并在长文本摘要任务中表现出色。
该研究提出一种新框架,通过将观察数据转化为知识图谱,增强人工智能在抽象推理中的逻辑性和表现。
本研究提出了一种新型深度学习架构,通过对象中心表示从像素中学习,解决自主智能体在感知输入与抽象推理之间的表示问题。该智能体能够在动态环境中在线适应并执行基于逻辑规则的目标控制,当前结果限于合成环境。
本文探讨了大型语言模型(LLMs)在类比推理方面的能力,发现其在知识泛化和抽象推理上存在局限,尚无法与人类的类比能力相媲美,需进一步改进。
OpenAI的下一代模型质量提升受到高质量数据减少的限制,Scaling Law可能不再适用。研究者提出了测试时训练(TTT)方法,显著提升了模型在抽象推理任务中的表现,挑战了传统依赖符号逻辑的假设。
本研究探讨在样本稀少情况下,推导潜在函数与直接预测新输出的优劣。通过分析ARC数据集中的抽象推理任务,发现归纳模型与传导模型在解决问题上具有互补特性。
研究探讨了视觉变换器在抽象推理任务中的应用,强调二维位置和对象的重要性。作者通过引入二维位置编码和对象中心表示来改进ViT的表现。实验显示这些改进显著提升了推理能力,但也增加了模型复杂性。研究建议进一步探索不同架构组件的相互作用及其对推理能力的影响。
本研究提出了CCSBench基准,以解决科学文献摘要中多属性组合控制不足的问题。实验结果表明,现有大型语言模型在平衡控制属性方面存在显著局限,尤其是在隐性属性的深层理解和抽象推理上。
本文介绍了LAPS技术,通过自然语言注释引导程序合成,提升搜索效率和泛化性。研究探讨了神经符号程序合成、数学推理及抽象概念的可解释性,提出了NEUMANN推理机制和RAISE解答生成方法,以提高人工智能在抽象推理任务中的表现,并发布了arckit Python库以促进ARC研究。
该研究提出多种方法解决抽象推理测验(ARC)任务,包括程序综合、图形抽象框架和归纳逻辑编程。通过引入特定领域语言和优化搜索策略,系统在ARC测试中表现优异。此外,研究探讨了神经网络与强化学习的结合,展示了新模型的有效性和广泛适用性,推动了人工智能在抽象推理领域的发展。
本研究探讨了神经网络的抽象推理能力,提出了新的数据集和模型架构,以提升推理能力。模型在某些泛化任务上表现优异,但在其他方面较弱。研究引入了DreamCoder和PeARL语言,显著改善了ARC任务的解决效果,并发布了arckit Python库以促进未来研究。
本文综述了大型语言模型(LLMs)在推理能力方面的研究进展,指出其在逻辑推理和抽象推理任务中的局限性,并提出多种提升模型推理能力的策略。通过构建数据集进行评估,验证了逻辑训练的有效性,同时探讨了人类与模型在推理表现上的差异,强调了改进模型性能的必要性。
本文介绍了一种基于认知创造力理论的计算模型,旨在提升人工智能的学习和推理能力。该模型结合了符号处理与神经网络,建立了目标导向的双重记忆系统,推动了人工通用智能的发展。同时,探讨了神经科学与认知心理学对人工智能的影响,强调了抽象推理和因果理解的重要性。
本研究提出了PMoC和Pose-Transformer模型,旨在提高机器在Bongard-Logo等抽象推理任务中的准确性。Pose-Transformer通过结合位置信息学习,增强了对图像数据的处理能力。实验结果表明,这些方法显著提升了推理准确性,推动了AI在抽象推理和认知模式识别方面的发展。
本文评估了大型语言模型在抽象推理任务上的表现,并提出了新的基准。作者探讨了差异原因,并综述了最新研究和概念生成。
完成下面两步后,将自动完成登录并继续当前操作。