小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
视频生成推理加速实践:基于全局时间索引的序列并行 3D 位置编码优化

本文探讨了哔哩哔哩在视频生成模型优化方面的实践,重点介绍了分块自回归模型的计算与通信优化。通过引入因果注意力和KV缓存机制,Self-Forcing模型实现了更高效的视频生成,降低了延迟,并支持长视频生成和实时推理。

视频生成推理加速实践:基于全局时间索引的序列并行 3D 位置编码优化

实时互动网
实时互动网 · 2026-02-13T06:39:19Z
生成1.8万年气候数据,英伟达等提出长距离蒸馏,仅需单步计算实现长期天气预报

AI天气预报模型通过生成合成气候数据,解决了长期预报中的数据稀缺问题。研究者提出的长距离蒸馏方法,利用自回归模型生成大量数据,训练出仅需单步计算的概率模型,显著提高了预报准确性,已达到与欧洲中期天气预报中心相当的水平。

生成1.8万年气候数据,英伟达等提出长距离蒸馏,仅需单步计算实现长期天气预报

HyperAI超神经
HyperAI超神经 · 2026-01-05T12:31:02Z

华人团队研究表明,扩散语言模型在token数量受限时,其数据潜力超过自回归模型三倍,且未出现性能饱和。该模型通过双向建模和高计算密度提升学习效果,且在过拟合情况下性能仍可能持续提升。

华人团队终结Token危机:扩散模型数据潜力超自回归三倍

量子位
量子位 · 2025-08-13T09:19:44Z

文章讨论了PD分离与引擎功能的适配,介绍了投机解码及其在大型自回归模型中的应用。通过引入小模型进行多次自回归,提升推理效率。探讨了Eagle 3的实现细节及其对推理性能的影响,得出礼貌性输入不影响推理性能的结论。

SpS, Eagle3: 礼貌一点会影响推理性能么?

学习让我快乐
学习让我快乐 · 2025-07-19T16:00:00Z

Decart推出的MirageLSD是首个实现零延迟、无限时长的实时视频生成模型,每秒生成24帧,响应速度比以往快16倍。该模型解决了传统自回归模型的“误差累积”问题,支持直播和游戏等多种形式,提升用户体验。

Karpathy都投的AI实时视频生成模型:直播立即转,无限时长零延迟

量子位
量子位 · 2025-07-19T06:13:47Z
Dream 7B:一种强大且开放的扩散语言模型

Dream 7B是一种新型的扩散语言模型,采用去噪方法,能够更好地处理上下文,提高生成灵活性和规划能力。与传统模型相比,Dream 7B在多项任务中表现优异,显示出扩散模型可能会取代自回归模型。

Dream 7B:一种强大且开放的扩散语言模型

The New Stack
The New Stack · 2025-06-03T17:00:59Z

本研究提出了数值标记完整性损失(NTIL),解决了自回归模型在顺序数值生成中忽视数字间连贯结构的问题,从而显著提升了模型性能。

Advancing Sequential Numerical Prediction in Autoregressive Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本文提出了一种新的不变ICL(InvICL)方法,旨在解决自回归大型语言模型中上下文学习对示例顺序敏感的问题。InvICL通过识别信息非泄漏和上下文相互依赖性,在多个基准数据集上表现优于现有模型,展现出更强的泛化能力。

Rethinking Invariance in In-context Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z
个性化图像:自回归模型在新研究中与扩散模型相媲美

个性化图像合成在文本到图像生成中至关重要,尤其在数字艺术和广告领域。研究探讨了自回归模型的潜力,提出了两阶段训练策略以优化文本嵌入和微调变换器层。实验结果表明,该方法在主题保真度和提示跟随方面与主流扩散模型相当,展示了自回归模型的有效性和应用前景。

个性化图像:自回归模型在新研究中与扩散模型相媲美

DEV Community
DEV Community · 2025-04-24T21:54:22Z

自回归模型适合生成离散信号的文本,而扩散模型更适合处理连续信号的图像。两者的本质差异源于文字和图像的特性。新模型Gemini通过转换技术实现多模态任务,但自回归模型在复杂图像生成上可能存在瓶颈。理解这些技术原理有助于选择合适的方案。

当文与图的界限开始模糊:聊聊自回归与扩散模型的「串台」趋势

少数派
少数派 · 2025-04-18T03:57:37Z
通过自回归模型的适应扩展扩散语言模型

扩散语言模型(DLMs)旨在克服自回归模型的局限性。本文提出通过适应自回归模型构建文本扩散模型,展示了自回归与扩散建模目标之间的联系,并介绍了一种持续预训练方法。实验结果表明,转换后的模型在语言建模和推理基准上表现优异,超越了早期的DLMs,并与自回归模型竞争。

通过自回归模型的适应扩展扩散语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-16T00:00:00Z
TokenBridge:弥合可视化生成中连续和离散token表示法之间的差距

自回归视觉生成模型通过离散和连续token实现高质量图像合成。TokenBridge采用新颖的训练后量化技术,显著提升生成效果,且在参数更少的情况下优于传统模型,为未来视觉合成技术提供新思路。

TokenBridge:弥合可视化生成中连续和离散token表示法之间的差距

实时互动网
实时互动网 · 2025-03-28T02:12:01Z
人工智能突破:新模型从长篇故事和复杂文本中生成更优质的图像

新型多模态自回归模型(MAR)能够有效生成长文本对应的图像,克服了现有模型在处理超过75字提示时的局限性。该方法保留了文本的语义,并提出了新的图像质量评估指标。

人工智能突破:新模型从长篇故事和复杂文本中生成更优质的图像

DEV Community
DEV Community · 2025-03-27T10:17:18Z

本研究提出MusiCoT技术,解决自回归模型在音乐生成中与人类创作过程不符的问题。该方法通过勾勒整体音乐结构,提高了音乐的连贯性和创造性。实验结果表明,MusiCoT在音乐质量上优于现有模型。

Analyzable Chain-of-Musical-Thought Prompting for High-Fidelity Music Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z
人工智能工具生成高质量图像的速度超过最先进的方法

MIT和NVIDIA的研究人员开发了HART工具,结合自回归模型与扩散模型,能够快速生成高质量图像。HART的速度比传统扩散模型快九倍,适用于机器人训练和游戏设计等多个领域。

人工智能工具生成高质量图像的速度超过最先进的方法

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-03-21T04:00:00Z

本研究提出了NFIG创新框架,解决自回归模型在图像生成中的长程依赖、计算成本和序列定义问题,通过分阶段生成低频和高频组件,提升图像质量并降低计算开销。

Next Frequency Prediction-Based Autoregressive Image Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究提出UniGenX框架,结合自回归模型与扩散模型,提升了材料晶体结构和小分子结构的预测能力,为科学数据生成提供了新工具。

UniGenX: Unified Generation of Sequence and Structure via Autoregressive Diffusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z
快速语言人工智能突破:新模型一次性生成文本,质量媲美顺序系统

研究提出大型语言扩散模型(LLDMs),作为自回归模型的替代方案。该模型结合扩散模型与语言建模,实现并行文本生成,降低计算需求,并在质量指标上与自回归模型相当。

快速语言人工智能突破:新模型一次性生成文本,质量媲美顺序系统

DEV Community
DEV Community · 2025-02-19T10:27:20Z

本研究提出了ARM4R自回归机器人模型,旨在解决机器人领域中有效表示和昂贵标注数据的问题。通过对人类视频学习的低级4D表示进行预训练,实现了高效的迁移学习,实验结果表明其在多种环境下的任务性能得到了提升。

基于4D表示的自回归机器人模型预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

LLaDA是一种新型语言生成模型,采用掩码扩散机制,突破了传统自回归模型的局限,展现出在可扩展性、上下文学习和指令遵循等方面的优越性。

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

机器之心
机器之心 · 2025-02-17T05:25:57Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码