小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了in-context learning (ICL)的概念和算法及其在multitask learning领域的应用。使用transformer model的方式,详细探讨了ICL在i.i.d.和动态数据下的泛化界限及其稳定性,以及任务复杂度和MTL任务数量对转移学习风险的影响。最后,提出了数值评估,并验证了理论预测。

变压器中新出现的情境学习的瞬时性质

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-14T00:00:00Z

该研究探讨了在大型语言模型中使用较少示例是否可以实现in-context learning,并发现仅使用一组随机选择的示例也可以实现接近于所有示例的性能。同时,研究发现ICL使用多个示例时的表现与预期情况相反,即当给出更多正确的/错误的示例时,ICL的准确性会下降/提高,这暗示着干扰和虚假关联可能会误导ICL。因此,LLMs培训,ICL和基准设计中需要解决若干基本挑战。

不是所有演示例子一样有益:重新加权演示例子进行上下文学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-12T00:00:00Z

AI应用面临挑战,缺乏核心壁垒,高效利用数据是关键。in-context learning和finetune优化模型,但NLP仍有问题。未来AI需高效利用数据迭代模型,可能进入Agent时代。AI发展对infra和开发工具有新需求。

AI 应用层的壁垒在哪里

高策
高策 · 2023-09-07T15:00:00Z
LLMs as Markov Chain

本文探讨了Andrej Karpathy关于语言模型(LM)作为有限状态马尔可夫链的观点。LM通过固定长度的上下文输入预测下一个词,状态空间由上下文长度和词汇量决定。文章分析了LM的训练过程、稀疏性、状态数的指数增长及同构现象,强调了数据对模型转移概率的影响,并介绍了Prompt Engineering和In-Context Learning的原理,指出如何通过调整输入提高模型输出的准确性。

LLMs as Markov Chain

Fatescript
Fatescript · 2023-06-03T15:59:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码