小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
《GPT 图解》笔记:GPT-从 Decoder 到自回归文本生成

本文讨论了GPT模型的结构及其自回归文本生成过程。GPT基于Decoder架构,采用贪婪解码和集束搜索策略生成文本。通过右移输入实现自回归,模型将输入和输出视为一个长序列,适用于多种生成任务。GPT的核心在于利用Causal Mask实现并行计算,简化了传统的编码-解码结构。

《GPT 图解》笔记:GPT-从 Decoder 到自回归文本生成

Ying’s Blog
Ying’s Blog · 2026-06-13T06:18:45Z
在线教程丨最高4倍生成速度提升,DiffusionGemma可同时生成整块文本,基于多轮并行去噪持续优化结果

Google于6月11日开源了基于离散扩散技术的文本生成模型DiffusionGemma。该模型具有高效的生成速度,能够以最高1100 Token/s的速度同时生成整个文本块,采用26B参数的混合专家设计,支持256K Token长上下文和多模态输入。尽管标准版Gemma 4在生成质量上更优,DiffusionGemma展示了新的发展方向。

在线教程丨最高4倍生成速度提升,DiffusionGemma可同时生成整块文本,基于多轮并行去噪持续优化结果

HyperAI超神经
HyperAI超神经 · 2026-06-12T10:10:12Z
Mythos阴影里谷歌悄悄发模型,速度暴涨4倍

谷歌推出了新型文本生成模型DiffusionGemma,采用扩散模型技术,生成速度比传统自回归模型快4倍。该模型一次性生成256个token,支持实时自我纠错,适合速度敏感的本地应用。尽管质量上与同类模型存在差距,但其并行计算能力展示了未来大模型的潜力。

Mythos阴影里谷歌悄悄发模型,速度暴涨4倍

量子位
量子位 · 2026-06-11T04:17:22Z
Google AI 发布 DiffusionGemma:基于文本扩散的 260 亿 MoE 开放模型,生成速度可提升 4 倍

谷歌AI团队发布了DiffusionGemma,一个260亿参数的开源文本生成模型。该模型采用文本扩散技术,支持并行生成,速度比传统自回归模型快4倍,适用于在线编辑、快速迭代和长文档分析等场景。尽管生成速度快,但输出质量低于标准Gemma 4,谷歌建议在生产中使用后者。

Google AI 发布 DiffusionGemma:基于文本扩散的 260 亿 MoE 开放模型,生成速度可提升 4 倍

实时互动网
实时互动网 · 2026-06-11T02:36:16Z
谷歌的DiffusionGemma比其他Gemma模型快4倍

谷歌推出了DiffusionGemma,这是一个实验性的文本生成模型,速度比现有模型快四倍。该模型使用扩散技术并行生成文本,每秒可生成超过1000个标记,适用于代码填充和数学图表等应用。虽然性能不及Gemma 4,但其重点在于速度。该模型已在HuggingFace上发布,并与Nvidia合作进行优化。

谷歌的DiffusionGemma比其他Gemma模型快4倍

The New Stack
The New Stack · 2026-06-10T17:18:54Z

DiffusionGemma是一种实验性文本生成模型,其生成速度比传统模型快4倍,能够并行生成256个标记,优化了GPU使用效率,适合实时交互应用。尽管输出质量低于标准Gemma 4,但可通过微调提升性能,特别适合非线性文本结构和快速迭代。

DiffusionGemma:文本生成速度提升至4倍

Google DeepMind Blog
Google DeepMind Blog · 2026-06-10T16:24:11Z
NVIDIA 加速谷歌 DeepMind 的 DiffusionGemma 本地 AI

谷歌DeepMind发布了DiffusionGemma,一个优化的文本生成模型,能够并行生成多个词,显著提高生成速度。该模型基于Gemma 4架构,性能比传统模型快4倍,适合低延迟的单用户应用,如互动聊天和智能助手,并支持本地生成,无需云计算。

NVIDIA 加速谷歌 DeepMind 的 DiffusionGemma 本地 AI

NVIDIA Blog
NVIDIA Blog · 2026-06-10T16:15:20Z

DiffusionGemma是一种实验性文本生成模型,采用文本扩散技术,速度比传统模型快4倍,能够同时生成256个标记,适用于实时交互应用。尽管输出质量低于Gemma 4,但可通过微调提升特定任务性能。该模型优化了硬件利用率,适合低并发本地推理。开发者可在Hugging Face获取模型权重并进行集成。

DiffusionGemma:文本生成速度提升4倍

The Keyword
The Keyword · 2026-06-10T16:00:00Z

Hugging Face推荐了七个适合2026年的文本生成图像模型,包括FLUX.1 Schnell(商业用途,生成速度快)、FLUX.1 Dev(个人和研究,质量高)、FLUX.1 Kontext Dev(支持图像编辑)、Stable Diffusion 3.5(丰富的社区生态)和Kolors(中英文内容生成)。所有模型均可免费使用,满足不同需求。

当前Hugging Face上最佳免费图像生成器!

KDnuggets
KDnuggets · 2026-06-09T14:00:10Z
今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手

Agnes AI正式向全球开发者免费开放文本、图片和视频API,旨在降低使用门槛,促进创作与开发。其模型能够生成高质量的交互稿、图像和视频,支持多种应用场景,简化操作以推动AI技术的实际应用。

今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手

量子位
量子位 · 2026-06-01T07:57:16Z

本文介绍了如何优化本地语言模型Ollama的配置,以提升AI应用的性能和准确性。通过调整模型参数、服务器环境变量和使用Go模板语法,用户可以实现更高效的文本生成,避免重复输出,并扩展上下文窗口,从而设计出高性能、私密的本地智能系统。

调整Ollama本地语言模型设置

KDnuggets
KDnuggets · 2026-05-28T14:00:17Z
何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明团队推出了新的扩散语言模型ELF,该模型采用连续的embedding空间进行文本生成,显著降低了生成困惑度。ELF在训练和采样效率上表现优异,仅用105M参数和45B训练token,生成质量超过主流模型。该模型首次实现了连续与离散的有效结合,推动了扩散语言模型的发展。

何恺明首个语言模型:105M参数,不走GPT自回归老路

量子位
量子位 · 2026-05-13T01:23:32Z
Modular:Inkwell:为何推理平台与模型同样重要

Modular推出了Gemma 4,旨在提升AI系统的响应速度。Tim Davis介绍了Inkwell,一个实时互动故事书应用,利用Modular Cloud实现快速文本和图像生成。通过优化推理层,Inkwell能在420毫秒内生成首个文本,并在6秒内完成插图,确保用户体验流畅,支持流式生成,减少等待时间,提升用户互动性。

Modular:Inkwell:为何推理平台与模型同样重要

Modular Blog
Modular Blog · 2026-05-12T00:00:00Z
从递归神经网络到变换器

自然语言处理经历了巨大的演变,传统的序列到序列模型依赖递归神经网络(RNN),但在处理长序列时存在信息瓶颈。为了解决这一问题,引入了注意力机制,使解码器能够动态关注输入序列的不同部分。现代的Transformer模型通过堆叠注意力层,能够高效处理复杂的序列数据,广泛应用于文本生成和图像处理等领域。

从递归神经网络到变换器

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-07T22:30:09Z
创造力是温柔的谎言

大模型生成文本时,通过预测下一个词元输出,使用Temperature、Top-p和Top-k参数控制输出的随机性和创造性。Temperature调节概率分布的尖锐程度,Top-k和Top-p限制候选词元的数量和概率密度。这些方法旨在提高生成内容的多样性和创造性,但模型仍基于概率随机选择,缺乏真正的创造过程。

创造力是温柔的谎言

Surmon.me
Surmon.me · 2026-03-29T16:00:21Z
为什么大模型的损失函数是交叉熵

大模型的损失函数主要是交叉熵,它通过概率和信息理论衡量模型输出与真实结果的差距。模型的目标是预测下一个token,损失函数通过负对数似然最小化错误概率。交叉熵量化模型分布与真实分布的一致性,反映生成文本的准确性。

为什么大模型的损失函数是交叉熵

木鸟杂记
木鸟杂记 · 2026-03-29T07:31:35Z

自2022年底发布以来,OpenAI的ChatGPT迅速普及。基于Transformer架构的大语言模型(LLM)展现出强大能力,尤其在文本生成和教学中表现优异,但仍需人类引导。未来,LLM可能面临训练数据劣化的瓶颈,并与人类智能存在本质差异。

三年LLM:过去和未来

Yi's Blog
Yi's Blog · 2026-03-28T05:00:00Z
面向未来的思考:变压器的潜在前瞻训练

本文介绍了一种名为“潜在前瞻”的训练策略,旨在提升自回归语言模型的文本生成能力。该方法通过多步前瞻提高预测准确性,实验结果显示其在迷宫求解、数独和ProsQA等任务中显著优于传统模型。

面向未来的思考:变压器的潜在前瞻训练

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-25T00:00:00Z
如何构建和优化AI中的RAG以获得可靠的答案

RAG(检索增强生成)结合信息检索与文本生成,通过外部数据源获取信息,生成准确响应,减少AI幻觉,提升生成质量,适用于客服聊天机器人等。构建RAG系统需关注数据、检索与生成,确保信息相关性和安全性,Meilisearch可优化检索过程,提升系统可靠性。

如何构建和优化AI中的RAG以获得可靠的答案

meilisearch blog
meilisearch blog · 2026-03-24T00:00:00Z

本文介绍了如何使用vLLM进行离线推理,特别是在视觉语言模型中采用正确的提示格式进行文本生成。示例展示了多种模型的提示格式和参数设置,以确保在不同GPU上有效运行。

【vLLM 学习】Vision Language

HyperAI超神经
HyperAI超神经 · 2026-03-09T02:10:53Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码