小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
生成与理解相互促进!华科字节提出Liquid,揭示统一多模态模型尺度规律!

AIxiv专栏报道Liquid框架,该框架通过VQGAN将图像编码为离散视觉token,实现多模态生成与理解的统一。Liquid无需修改现有大语言模型,降低训练成本并保留语言能力,推动多模态智能发展。实验结果表明,Liquid在视觉生成和理解任务中表现优异,验证了多模态任务的互惠关系。

生成与理解相互促进!华科字节提出Liquid,揭示统一多模态模型尺度规律!

机器之心
机器之心 · 2025-03-04T01:18:16Z

本研究通过语义在线聚类方法增强标记的语义,实现更有效的词典表示。SGC-VQGAN在重建质量和下游任务中表现出最先进的性能,具备直接应用于下游任务的潜力。

SGC-VQGAN:通过语义引导聚类词典实现复杂场景表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

该研究提出了GPTVQ方法,通过增加量化维度改善神经网络量化的大小和准确性之间的权衡。GPTVQ使用向量量化对大型语言模型进行训练,并使用每层输出重建MSE的Hessian信息。该方法在各种语言模型上实现了新的最先进的大小与准确性权衡状态。此外,研究还显示在移动CPU上使用VQ解压缩相比使用4位整数格式可以提供改进的延迟。

将 VQGAN 的码本大小扩展至 100,000,利用率为 99%

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

该研究使用Transformer模型架构,将自我关注机制限制在局部邻域,提高了模型处理大图像的能力,并在图像生成方面表现优异。此外,该研究还进行了图像超分辨率实验,发现其生成的图像比之前的最优模型更能欺骗人类观察者。

Efficient-VQGAN: 高分辨率图像生成的高效视觉 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码