小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种名为Trelawney的方法,旨在解决因果语言模型训练中标记预测与人类写作推理过程的差异。通过重新排列训练数据,该方法在规划、算法推理和故事生成任务上显著提升了模型的能力。

Looking Beyond the Next Token

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出COAST方法,通过因果语言模型动态调整时间步长,在复杂区域使用小步长,在简单区域使用大步长,从而显著提高计算效率和准确性。COAST在多种动态系统中优于现有技术,展示了智能自适应求解器的潜力。

COAST:智能时间自适应神经算子

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本研究提出了一种新的分组交叉注意力模块,解决了检索基础语言模型在因果语言模型中的适应问题。通过联合预训练,该模型能有效检索过去的文本块,降低生成文本的自回归损失。在长达64K的上下文长度下实现高效预训练,同时保持较低的困惑度和成本。

Efficient Long-Range Language Modeling Based on Self-Supervised Causal Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

编码器-解码器和仅解码器模型是自回归模型,具有不同的优缺点。去噪目标可作为因果语言模型的补充。双向注意力对较小规模模型有帮助。BERT模型已被弃用,取而代之的是更灵活的去噪T5模型。

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

机器之心
机器之心 · 2024-07-22T06:54:31Z

大模型(如chatGPT)的训练是通过自监督学习进行的,自监督学习是一种无监督学习方式,通过伪标签进行训练。常见的自监督学习任务有掩码语言模型和因果语言模型。因果语言模型通过预测下一个词来学习文本的顺序结构和语言生成过程。通过自监督学习,模型可以学习到自然语言的结构和句式。

3分钟搞懂大模型的训练过程

六虎
六虎 · 2024-04-11T03:52:43Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码