小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

MiniMax海螺视频团队首次开源了视觉分词器预训练框架VTP,解决了算力与生成效果不成正比的问题。研究表明,传统Tokenizer的重建精度与生成质量无关,而VTP强调理解力,提升生成性能。VTP展示了Tokenizer的Scaling Law,优化Tokenizer可有效提升生成系统性能。

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

量子位
量子位 · 2025-12-22T05:02:28Z

谢赛宁团队的新论文iREPA源于一次推特辩论,研究空间结构对生成性能的影响。结果表明,空间结构对生成质量的影响超过全局语义,iREPA实现简单,仅需3行代码,显著提升性能。

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

量子位
量子位 · 2025-12-16T07:03:31Z

本文提出了一种新方法Robo-SGG,通过布局嵌入编码器(LEE)提升受损图像的场景图生成效果,显著提高生成性能,对该领域具有重要影响。

Robo-SGG: Achieving Robust Scene Graph Generation through Layout-Guided Normalization and Restoration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z
简单ReFlow:快速流模型的改进技术

扩散和流匹配模型在生成性能上表现优异,但采样步骤多,影响推理速度。ReFlow程序通过简化生成轨迹加速采样,但需迭代训练,导致样本质量下降。我们提出七项改进,并在CIFAR10、AFHQv2和FFHQ上进行实验,结合技术后在快速生成中实现了最先进的FID分数。

简单ReFlow:快速流模型的改进技术

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-10T00:00:00Z

本研究提出了一种去噪分数蒸馏(DSD)方法,旨在提升扩散模型在低质量数据下的生成性能。通过在噪声样本上预训练并蒸馏为一步生成器,DSD显著改善了生成样本的质量。

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究首次探讨链式思维推理在自回归图像生成中的应用,提出三种技术显著提升生成性能,尤其是通过潜力评估奖励模型使生成结果提高24%。

Can We Generate Images with Chain-of-Thought? A Step-by-Step Validation and Enhancement of Image Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出了一种基于分段的注意力屏蔽方法,解决了GPT模型在处理用户提示时的注意力限制问题。通过非因果方式访问信息,提升了生成性能。实验结果表明,该方法在Llama和Qwen等模型中表现优异。

Segment-Based Attention Masking for GPT Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究通过引入基于知识图的RAG和自我校正机制,克服了文本到图像模型在复杂文化主题上的局限,显著提升了多种模型的生成性能。

上下文画布:通过基于知识图的RAG增强文本到图像扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

AIxiv专栏促进学术交流,报道超过2000篇内容。斯坦福大学等机构提出的无训练指导框架TFG,解决了扩散模型的条件生成问题,提升了生成性能。TFG在多个领域表现优异,未来有望应用于药物设计等领域。

NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

机器之心
机器之心 · 2024-12-05T03:46:52Z

本研究提出了一种两阶段微调框架,有效解决了差分隐私下生成表格数据的挑战,显著提升生成性能并更合理利用隐私预算。

DP-2Stage: Adapting Language Models for Differentially Private Table Data Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本研究探讨了思想树(ToT)在大型语言模型中的表现,发现生成器在ToT的成功中更为关键,而区分器的作用有限。不同规模模型的区分能力相似,但生成性能差异显著。

理解什么情况下思想树成功:更大的模型在生成上表现优于区分

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z
RAG:通过外部知识增强大型语言模型以生成信息性文本

该论文研究了检索增强文本生成(RAG)技术,旨在提高大型语言模型(LLMs)的生成性能。RAG框架将LLMs与外部知识相结合,生成更具信息性和连贯性的文本。论文详细解释了RAG框架及其组成部分,讨论了各种架构和训练方法,以及实证研究中的见解和挑战。该论文全面调查了RAG用于LLMs的方法,提供了增强LLMs能力的有希望的方法。

RAG:通过外部知识增强大型语言模型以生成信息性文本

DEV Community
DEV Community · 2024-08-26T08:09:24Z

使用Transition-aware weighted Denoising Score Matching(TDSM)训练带噪声标签的条件扩散模型,TDSM目标函数整合了得分网络的加权和,实验证明TDSM可以提高生成样本质量,改进生成性能。

标签噪声鲁棒扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码