小红花·文摘

本研究提出了一种基于隐式神经表示的切片到体积重建方法，能够从多张运动干扰的低分辨率2D切片中快速准确地重建高分辨率MRI图像。实验结果表明，该方法在重建质量上显著优于现有技术，并能减少多达50%的重建时间。

Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations

BriefGPT - AI 论文速递 ·

本文研究了传统体素方法在高比特深度点云处理中的局限性，提出了一种分阶段的空间到通道(S2C)上下文模型，改进了数据压缩效果并降低了计算复杂性。通过几何残差编码(GRC)和球坐标系统，该方法提高了重建质量，节省了数据位数，展示了在稠密和低级稀疏点云上的应用潜力。

Voxel-based Point Cloud Geometry Compression and Space-to-Channel Model

BriefGPT - AI 论文速递 ·

One-D-Piece：图像Tokenizer满足质量可控压缩

实时互动网 ·

用于多视角视频压缩的显隐混合表达

实时互动网 ·

用基础扩散模型实现有损图像压缩 | ECCV 2024

实时互动网 ·

本研究提出了一种新模型，通过渐进训练高压缩块，实现视频分词器在不增加通道容量的情况下，时间压缩比超过4倍，显著提升重建质量和效率，对视频生成具有重要影响。

视频分词器的渐进式生长用于高压缩潜在空间

BriefGPT - AI 论文速递 ·

本研究提出FLowHigh方法，针对音频超分辨率中的病态问题，应用高效生成模型流匹配技术，显著提升重建质量。实验结果表明，FLowHigh在VCTK基准数据集上表现优异，仅需单步采样，降低计算延迟。

FLowHigh: A Single-Step Flow Matching Method Towards Efficient and High-Quality Audio Super-Resolution

BriefGPT - AI 论文速递 ·

微软开源了新的视频Tokenizer VidTok，其性能显著优于Cosmos Tokenizer和Open-Sora。VidTok支持多种设置，适用于不同场景，并可在自定义数据集上微调。其创新架构和量化技术提升了重建质量和训练效率，为视频生成和世界模型研究提供了强大工具。

微软开源视频Tokenizer新SOTA！显著优于Cosmos Tokenizer和Open-Sora

量子位 ·

本研究提出了TexTok框架，解决了现有图像标记化方法在高分辨率生成中的低压缩率问题。TexTok结合文本描述，显著提高了重建质量和生成速度，推动了图像生成技术的发展。

Language-Guided Image Tokenization Generation

BriefGPT - AI 论文速递 ·

本研究提出了一种新的分组球面量化（GSQ）方法，解决了图像标记器在可扩展性和分析全面性上的不足。GSQ-GAN在较少的训练迭代中实现了优越的重建质量，展现了高维隐空间的有效压缩与重构能力。

Expanding Image Taggers Using Group Spherical Quantization

BriefGPT - AI 论文速递 ·

本文介绍了基于3D高斯模型的技术进展，如pixelSplat和MVSplat。这些模型在重建3D辐射场时表现出高效性和准确性，尤其在处理稀疏视角和细节丰富的场景时。研究通过新方法和框架提升了重建质量和速度，并展示了良好的跨数据集泛化能力。

SmileSplat：适用于无约束稀疏图像的通用高斯点云

BriefGPT - AI 论文速递 ·

本研究提出小波流变分自编码器（WF-VAE），旨在解决视频变分自编码器在生成高分辨率和长时长视频时的编码成本问题。WF-VAE通过小波变换增强潜在表示的低频能量流，并采用因果缓存方法以确保潜在空间的完整性。实验结果表明，WF-VAE在PSNR和LPIPS指标上优于现有方法，吞吐量提高2倍，内存消耗降低4倍，同时保持重建质量。