小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了大语言模型(LLMs)的因果推理能力,分析其表现机制及因果与反因果学习对自然语言处理任务的影响。通过创新的数据集和基准任务,识别改善LLMs因果能力的挑战与机遇,为未来研究奠定基础。

Causality in Natural Language Processing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本研究探讨大型语言模型在干扰条件下的两跳推理能力,揭示其从随机猜测到精准推理的学习机制。通过训练三层变换器,发现模型初期受干扰影响,但最终能够忽略干扰,实现高准确率,为理解LLMs的推理过程提供新视角。

How Do Large Language Models Perform Two-Hop Reasoning in Context?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z

本研究探讨了语言模型逐字检索上下文信息能力的发展,发现该能力在训练初期发生显著转变,并与零样本学习相关。具体名词的检索优势在初期明显,但最终减弱,为理解语言模型的学习机制提供了重要见解。

跨时间和规模的变压器逐字上下文检索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

研究发现大型语言模型在算术学习中能识别部分积,但未能有效运用。模型采用从易到难的学习策略,强调深入理解其学习机制的重要性。

语言模型是算术中的符号学习者

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本研究提出了一种新学习机制,通过利用系统参数中的噪声和全局增强信号,采用朗斯坦-乌伦贝克过程进行自适应学习,解决了梯度下降在生物和神经形态系统中的实施困难。结果表明,该方法可替代传统梯度方法,具有神经形态计算的应用潜力。

朗斯坦-乌伦贝克适应作为大脑与机器学习的机制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

研究发现,高秩的初始权重会导致懒惰的学习,而低秩的初始权重则倾向于更丰富的学习。然而,与任务和数据统计信息一致的低秩初始权重仍可能导致懒散学习。初始权重结构在塑性代谢成本和灾难性遗忘风险方面起关键作用。

神经电路中连通性结构对丰富与懒散学习的塑造

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码