小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究评估了大语言模型在常识理解和抽象推理中的不足,并提出了两种提示方法。实验结果显示,使用示例指导选择关系时准确性有所提高,但在限制预测单一关系时表现下降。这表明,尽管模型在常识推理方面仍存在差距,设计良好的提示方法能够提升其性能。

Exploring Semantic Relations: Challenges for Language Models in Common-Sense Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z
Meta开源大型概念模型,一种能够预测完整句子的语言模型

Meta最近开源了大型概念模型(LCM),该模型在更高抽象层次上操作,使用独立于语言和模态的句子嵌入空间。LCM在多语言摘要任务中优于同规模的Llama 3.1模型,支持200种语言的文本和76种语言的语音数据,旨在更好地模拟人类的抽象推理能力,并在长文本摘要任务中表现出色。

Meta开源大型概念模型,一种能够预测完整句子的语言模型

InfoQ
InfoQ · 2025-01-28T14:00:00Z

该研究提出一种新框架,通过将观察数据转化为知识图谱,增强人工智能在抽象推理中的逻辑性和表现。

Causal Symbolic Solver on the Abstraction and Reasoning Corpus

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了一种新型深度学习架构,通过对象中心表示从像素中学习,解决自主智能体在感知输入与抽象推理之间的表示问题。该智能体能够在动态环境中在线适应并执行基于逻辑规则的目标控制,当前结果限于合成环境。

Object-Centric Proto-Symbolic Behavioral Reasoning from Pixels

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本文探讨了大型语言模型(LLMs)在类比推理方面的能力,发现其在知识泛化和抽象推理上存在局限,尚无法与人类的类比能力相媲美,需进一步改进。

评估大型语言模型在类比推理中的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z
连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路

OpenAI的下一代模型质量提升受到高质量数据减少的限制,Scaling Law可能不再适用。研究者提出了测试时训练(TTT)方法,显著提升了模型在抽象推理任务中的表现,挑战了传统依赖符号逻辑的假设。

连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路

机器之心
机器之心 · 2024-11-12T05:15:14Z

本研究探讨在样本稀少情况下,推导潜在函数与直接预测新输出的优劣。通过分析ARC数据集中的抽象推理任务,发现归纳模型与传导模型在解决问题上具有互补特性。

Combining Induction and Transduction for Abstract Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

研究探讨了视觉变换器在抽象推理任务中的应用,强调二维位置和对象的重要性。作者通过引入二维位置编码和对象中心表示来改进ViT的表现。实验显示这些改进显著提升了推理能力,但也增加了模型复杂性。研究建议进一步探索不同架构组件的相互作用及其对推理能力的影响。

视觉变换器在抽象视觉推理中的增强:二维位置与对象

DEV Community
DEV Community · 2024-10-16T07:12:21Z

本研究提出了CCSBench基准,以解决科学文献摘要中多属性组合控制不足的问题。实验结果表明,现有大型语言模型在平衡控制属性方面存在显著局限,尤其是在隐性属性的深层理解和抽象推理上。

CCSBench: Evaluating Compositional Controllability of Large Language Models in Scientific Document Summarization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本文介绍了LAPS技术,通过自然语言注释引导程序合成,提升搜索效率和泛化性。研究探讨了神经符号程序合成、数学推理及抽象概念的可解释性,提出了NEUMANN推理机制和RAISE解答生成方法,以提高人工智能在抽象推理任务中的表现,并发布了arckit Python库以促进ARC研究。

通过神经符号程序合成和任务生成学习解决抽象推理问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

该研究提出多种方法解决抽象推理测验(ARC)任务,包括程序综合、图形抽象框架和归纳逻辑编程。通过引入特定领域语言和优化搜索策略,系统在ARC测试中表现优异。此外,研究探讨了神经网络与强化学习的结合,展示了新模型的有效性和广泛适用性,推动了人工智能在抽象推理领域的发展。

ARCLE: 强化学习的抽象和推理语料学习环境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-30T00:00:00Z

本研究探讨了神经网络的抽象推理能力,提出了新的数据集和模型架构,以提升推理能力。模型在某些泛化任务上表现优异,但在其他方面较弱。研究引入了DreamCoder和PeARL语言,显著改善了ARC任务的解决效果,并发布了arckit Python库以促进未来研究。

探究人工神经网络中的学习无关抽象推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本文综述了大型语言模型(LLMs)在推理能力方面的研究进展,指出其在逻辑推理和抽象推理任务中的局限性,并提出多种提升模型推理能力的策略。通过构建数据集进行评估,验证了逻辑训练的有效性,同时探讨了人类与模型在推理表现上的差异,强调了改进模型性能的必要性。

超越准确性:评估大型语言模型的推理行为 -- 调查研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

本文介绍了一种基于认知创造力理论的计算模型,旨在提升人工智能的学习和推理能力。该模型结合了符号处理与神经网络,建立了目标导向的双重记忆系统,推动了人工通用智能的发展。同时,探讨了神经科学与认知心理学对人工智能的影响,强调了抽象推理和因果理解的重要性。

A (G) I 挑战,奥罗伯洛斯模型中的控制论复苏之一

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-07T00:00:00Z

本研究提出了PMoC和Pose-Transformer模型,旨在提高机器在Bongard-Logo等抽象推理任务中的准确性。Pose-Transformer通过结合位置信息学习,增强了对图像数据的处理能力。实验结果表明,这些方法显著提升了推理准确性,推动了AI在抽象推理和认知模式识别方面的发展。

D4C 手套训练:通过分布和圈定概念解决 RPM 和 Bongard-logo 问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

本文评估了大型语言模型在抽象推理任务上的表现,并提出了新的基准。作者探讨了差异原因,并综述了最新研究和概念生成。

面向概念感知的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码