小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究评估了大语言模型在常识理解和抽象推理中的不足,并提出了两种提示方法。实验结果显示,使用示例指导选择关系时准确性有所提高,但在限制预测单一关系时表现下降。这表明,尽管模型在常识推理方面仍存在差距,设计良好的提示方法能够提升其性能。

Exploring Semantic Relations: Challenges for Language Models in Common-Sense Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z
Meta开源大型概念模型,一种能够预测完整句子的语言模型

Meta最近开源了大型概念模型(LCM),该模型在更高抽象层次上操作,使用独立于语言和模态的句子嵌入空间。LCM在多语言摘要任务中优于同规模的Llama 3.1模型,支持200种语言的文本和76种语言的语音数据,旨在更好地模拟人类的抽象推理能力,并在长文本摘要任务中表现出色。

Meta开源大型概念模型,一种能够预测完整句子的语言模型

InfoQ
InfoQ · 2025-01-28T14:00:00Z

该研究提出一种新框架,通过将观察数据转化为知识图谱,增强人工智能在抽象推理中的逻辑性和表现。

Causal Symbolic Solver on the Abstraction and Reasoning Corpus

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了一种新型深度学习架构,通过对象中心表示从像素中学习,解决自主智能体在感知输入与抽象推理之间的表示问题。该智能体能够在动态环境中在线适应并执行基于逻辑规则的目标控制,当前结果限于合成环境。

Object-Centric Proto-Symbolic Behavioral Reasoning from Pixels

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本文探讨了大型语言模型(LLMs)在类比推理方面的能力,发现其在知识泛化和抽象推理上存在局限,尚无法与人类的类比能力相媲美,需进一步改进。

评估大型语言模型在类比推理中的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z
连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路

OpenAI的下一代模型质量提升受到高质量数据减少的限制,Scaling Law可能不再适用。研究者提出了测试时训练(TTT)方法,显著提升了模型在抽象推理任务中的表现,挑战了传统依赖符号逻辑的假设。

连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路

机器之心
机器之心 · 2024-11-12T05:15:14Z

本研究探讨在样本稀少情况下,推导潜在函数与直接预测新输出的优劣。通过分析ARC数据集中的抽象推理任务,发现归纳模型与传导模型在解决问题上具有互补特性。

Combining Induction and Transduction for Abstract Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

研究探讨了视觉变换器在抽象推理任务中的应用,强调二维位置和对象的重要性。作者通过引入二维位置编码和对象中心表示来改进ViT的表现。实验显示这些改进显著提升了推理能力,但也增加了模型复杂性。研究建议进一步探索不同架构组件的相互作用及其对推理能力的影响。

视觉变换器在抽象视觉推理中的增强:二维位置与对象

DEV Community
DEV Community · 2024-10-16T07:12:21Z

本研究提出了CCSBench基准,以解决科学文献摘要中多属性组合控制不足的问题。实验结果表明,现有大型语言模型在平衡控制属性方面存在显著局限,尤其是在隐性属性的深层理解和抽象推理上。

CCSBench: Evaluating Compositional Controllability of Large Language Models in Scientific Document Summarization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本文介绍了LAPS技术,通过自然语言注释引导程序合成,提升搜索效率和泛化性。研究探讨了神经符号程序合成、数学推理及抽象概念的可解释性,提出了NEUMANN推理机制和RAISE解答生成方法,以提高人工智能在抽象推理任务中的表现,并发布了arckit Python库以促进ARC研究。

通过神经符号程序合成和任务生成学习解决抽象推理问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究在抽象推理领域提出了D2C、D3C和D3C-cos方法,通过度量图像表示的分布和限制分布距离来提高推理准确性和计算效率。引入Lico-Net网络解决问题求解和可解释性挑战,并通过对比D2C和D4C方法改进概念边界。为抽象推理领域提供新的视角和解决方案。

D4C 手套训练:通过分布和圈定概念解决 RPM 和 Bongard-logo 问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

本研究通过创新的网络设计解决抽象推理问题,引入了Triple-CFN方法来应对Bongard-Logo问题,实现了显著的推理准确性。同时,通过修改,Triple-CFN在RPM问题上取得了竞争性的结果。为了进一步提高性能,开发了Meta Triple-CFN网络,保持可解释性。Meta Triple-CFN的成功归功于对概念空间建模的范式。通过引入Re-space层,加强了Meta Triple-CFN和Triple-CFN的性能。该研究旨在促进机器智能的进步,为该领域的突破铺平道路。

Triple-CFN:重构观念空间以增强抽象推理过程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

本研究介绍了PMoC和Pose-Transformer,用于解决抽象推理问题。PMoC是一种概率模型,通过构建独立的概率模型实现高准确性的推理。Pose-Transformer是一种增强型Transformer-Encoder,结合了位置信息学习,提高了对图像数据中局部位置关系的关注。该方法在RAVEN和PGM数据库上超过了之前的模型,对推进AI在抽象推理和认知模式识别方面具有重要贡献。

建模概率模型解决邦加德 - 标志问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

本文评估了大型语言模型在抽象推理任务上的表现,并提出了新的基准。作者探讨了差异原因,并综述了最新研究和概念生成。

面向概念感知的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码