小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了Music2Latent2音频自编码器,旨在高效压缩音频信号并保持音频质量。通过无序摘要嵌入和自回归模型,该方法显著提高了重构质量,优于现有音频自编码器。实验结果表明,其在音频质量和下游任务性能上表现更佳。

Music2Latent2: Audio Compression Based on Summary Embeddings and Autoregressive Decoding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z

本研究提出了QUEEN框架,旨在解决在线自由视角视频流媒体的增量更新和实时约束问题。通过学习帧间高斯属性残差,QUEEN显著提升了重构质量和泛化能力,模型每帧仅0.7MB,训练时间少于5秒,渲染速度达到350FPS,超越了现有方法。

QUEEN: Quantized Efficient Encoding of Dynamic Gaussians for Streaming Free-viewpoint Videos

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

介绍了HNeRV混合神经表示方法,提升视频回归任务的重构质量和收敛速度,适用于视频压缩和视频修补等下游任务。

VQ-NeRV:一种用于视频的向量量化神经表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

该文介绍了一种利用编码字典中关于张量模式的先验结构信息来获得稀疏编码的张量因子的多字典张量分解(MDTD)框架。实验证明,MDTD 相比无字典方法学习到更简洁的模型,且在重构质量、缺失值插补质量和张量秩的估计等方面均具有明显的改进,而且不会增加运行时间。

多词典张量分解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码