小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了大型语言模型(LLMs)在推理和组合能力方面的限制。尽管在75%的数据集上能够生成类人类的反应,但仍需进一步改进。这为理解LLMs的认知能力提供了重要见解。

人工智能仍然是智能吗?大型语言模型在新颖形容词-名词组合上的一般化能力,但无法模拟完整的人类分布

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

研究发现,Transformer语言模型在学习离散算法方面的能力有限,效果不如重新学习所有子任务。复杂性理论的定理证明了在记忆前馈模型上的梯度下降可能在数据效率上低效。

通过隐含组合进行算法归纳的任务无关架构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

该研究提出了一种新的训练目标,通过微调预训练模型实现一致性的T2I扩散模型,提高了个性化T2I模型的组合能力,并引入了控制图像保真度和提示保真度权衡的抽样方法。研究还强调使用详尽的标题作为参考图像,以增强图像和文本的对齐。

基于直接一致性优化的文本到图像个性化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

我们研究了Transformer语言模型在学习离散算法方面的能力。发现最先进的Transformer语言模型在组合能力上有限,效果不如重新学习所有子任务。同时证明了记忆前馈模型上的梯度下降可能在数据效率上指数级低效。

变压器语言模型在算法学习上的限制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-08T00:00:00Z

该研究提出了一种记忆增强神经模型,通过基于神经网络和具有符号功能的可变插槽进行变通泛化,实现变通组合能力。实验结果表明,在 well-known benchmark SCAN 上,该模型具有极强的组合泛化能力,以 100%精度解决了之前工作中面临的所有挑战。

系统化综合的组合式程序生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码